We-Co

[We-Co] 2024년 3월 기준 분야별 SOTA 본문

AI논문

[We-Co] 2024년 3월 기준 분야별 SOTA

위기의코딩맨 2024. 3. 13. 13:42
반응형

안녕하세요. 위기의코딩맨입니다.

제 블로그에서 SOTA를 소개하고 확인하는 방법에 대해서 간단하게 설명한 포스팅이 있습니다.

그 포스팅이 꽤나 조회수가 나오더라구요. ㅎㅎ

궁금하신 분들은 아래 포스팅을 확인해주세요!

 

[We-Co] SOTA - 이것이 무엇인고!

안녕하세요. 위기의 코딩맨입니다. 저번에 AI 모델 순위를 확인할 수 있는 사이트 papers with code 사용법에 대해서 소개해드렸는데요! 많이 사용되는 데이터셋의 순위, 해당 분야에서의 SOTA에 대해

we-co.tistory.com

 

그래서 오늘은 2024년 3월 기준,

현재 몇가지 분야가 있으며, 그 분야의 Best Model을 확인해보겠습니다.

그리고 SOTA 선정의 기준은 Dataset과 연구 목적에 따라 다르지만,

성능지표, 효율성, 범용성 등등 여러가지 조건을 갖고 선정한다고 합니다.

 

 

[  Browse State-Of-The-Art ]

우선 해당 사이트에서 확인을 진행해야합니다.

아래 링크를 확인해보시면 분야와 SOTA를 확인하실 수 있습니다.

 

Papers with Code - Browse the State-of-the-Art in Machine Learning

12526 leaderboards • 4750 tasks • 9380 datasets • 121316 papers with code.

paperswithcode.com

 

 

현재 약 16가지의 분야에서 모델이 생성되고, 

지속적으로 연구가 계속되고 있는것 같습니다.

임의로 10가지 항목의 분야를 선택해서 설명드리도록 하겠습니다.

 

1.Computer Vision

Computer Vision 분야는 사진, 비디오 등 다양한 이미지에서 분석해서 원하는 값을 추출하는 분야입니다.

객체인식을 통한 다양한 솔루션을 제공할 있지만, 컴퓨터의 상당한 성능을 요구하는 문제점이 있습니다.

현재는 아래 5가지 항목이 SOTA로 보여집니다.

[Semantic Segmentation, ImageClassification, Object Detection, Contrastive Learning, Image Generation]

2. Natural Language Processing

자연어 처리는 컴퓨터가 인간의 언어를 이해하고 해석하여 서로 상호작용을 할 수 있도록 도움을 주는 분야입니다.

기계번역, 음성인식 다양한 분야에서 사용되고 있습니다. 또한, 수학적으로 다양하게 연구되고 있는 분야 하나로 알고있습니다.

[Language Modelling, Translation, Question Answering, Machine Translation, Text Generation]

 

3. Medical

해당 분야는 생명가 직결되는 부분이라 예민한 부분을 갖고있습니다. CT나 MRI 와 같은 이미지를 통해서 병을 예측하거나 진단하고,

다양한 데이터를 통해 유행하는 병을 예측할 수 있습니다. 그러나 AI는 100%는 없기때문에 맹신하면 안됩니다.

[Medical Image segmentation, EEG, Drug Discovery, Property Prediction, Lesion Segmentation]

 

4. Miscellaneous

해당 분야는 아래에 기술되지 않은 다양한 분야에서 연구되고, 개발되고 있는 모델에 대한

성과를 보여지는 분야로 생각하시면 될 것 같습니다.

[Transfer Learning, BIG-bench Machine Learning, Benchmarking, Recommendation Systems, Fairness]

 

5. Time Series

시계열 데이터 분야입니다. 시간의 흐름에 따라 순차적으로 기록되는 데이터를 의미하며, 

통계학, 데이터 과학의 한 부분이라고 생각하시면 됩니다.

이상치 탐지, 예측, 추세 분석등을 확인하는 목적을 갖고있으며

주식, 의료기록, 센서 데이터 등에 다양한 분야에서 사용되고 있는 분야입니다.

[Time Series Analysis, Computational Efficiency, Time Series Forecasting, Electroencephalogram, Imputation]

 

6. Graphs

수학적 이론을 바탕으로한 그래프에 대한 분야이며, 네트워크 분석에 활용됩니다.

유용한 데이터의 관리, 탐색에 대한 연구 개발을 진행하는 분야입니다.

[Link Prediction, Node Classification, Graph Embedding, Graph Learning, Graph Classification]

 

7. Speech

음성 신호에 대한 처리 분야입니다. 인간의 목소리를 컴퓨터가 이해하고 서로 상호작용할 수 있도록 연구 및 개발하는 분야입니다.

스마트폰, 자동차, 보안 다양한 분야에서 사용되고 있습니다.

[Speech Recognition, ASR, Speech Synthesis, Dialogue Generation, Speech Enhancement]

 

8. Audio

소리에 대한 연구 분야이며, 캡처, 생성, 처리, 전송 등에 초점을 맞춘다고 합니다.

녹음, 라이브 공연, 가상환경 등에 사용되고 있습니다.

[Speech Synthesis, Video Generation, Voice Conversion, Music Generation, Audio Classification]

 

9. Playing Games

게임에 대한 분야이지만, 단순히 오락을 넘어서 교육, 훈련, 치료 등 다양한 목적에 활용하기 위한 연구 및 개발을 진행하고 있습니다.

알파고 등으로 강화학습에 대한 분야가 유명해졌지만, 이제는 강화학습에 국한되어 있지 않으며 다양하게 활용되고 있습니다.

[Sentence, Continuous Control, Atari Games, OfflineRL, OpenAI Gym]

 

10. Robots

공학과 컴퓨터 과학이 종합적으로 연구 및 개발되는 분야입니다.

의료, 서비스, 탐사 등 다양한 솔루션을 제공하고 있으며,

정밀한 동작이 중요시되어, 수학적인 요소가 중요시 되는 분야입니다.

[Benchmarking, Motion Planning, Robot Navigation, Visual Navigation, Visual Odometry]

 

 

이렇게 10가지 분야가 대체적으로 설명드렸으며,

나머지 6가지 분야는 Reasoning, Computer Code, Adversarial, Knowledge Base, Music, Methodology 

SOTA 모델의 연구가 지금도 계속 되고 있습니다.

너무나도 기술 발전이 빠르게 진행되고 있다는게 느껴집니다.

반응형