[AI] LLM 이란 무엇인가?! - 대형 언어 모델

안녕하세요. 위기의 코딩맨입니다.

오늘은 요즘 엄청난 붐을 일으키고 있는 LLM에 대해서 간단하게 알아보도록 하겠습니다.

간단하게 가능하려나..?

[ 정의 ]

먼저 LLM의 정의를 알아보도록 하겠습니다.

Large Language Model을 약어로 만들어서 LLM으로 간단하게 불리고 있습니다.

대형 언어 모델을 의미하며 분야는 NLP 쪽으로 생각하시면 될 것 같습니다.

정말 간단하게 정의하자면 텍스트를 인간처럼 이해하도록 설계되어 있는 모델입니다.

무수히 많은 파라미터를 보유하고있으며, 인공 신경망을 구성한 언어적인 모델입니다.

요즘 AI 챗봇이나 음성 인식 등 다양한 분야에 사용 되고 있습니다.

모든 모델이 데이터를 기반으로 학습을 하고 활용하여 작동을 진행합니다.

시계열 데이터의 특성을 갖고있는 언어는 입력과 같은 순차적인 처리를 중요시 해야함으로

트랜스포머를 기반으로 하고있습니다.

예전에 트랜스포머에 대해서 간단하게 알아봤는데 한번 참고하셔도 될것같습니다.

[We-Co] Transformer - Tensorflow, NLP

안녕하세요. 위기의 코딩맨입니다. 오늘은 Transformer에 대해서 간단하게 알아보도록 하겠습니다 [ Transformer ] "Attention is all you need"의 제목으로 2017년 구글에서 발표한 모델입니다. 기존의 Seq2Seq의

we-co.tistory.com

NLP 분야에선 트랜스포머와 토큰화의 작업이 중요하다고 생각합니다.

해당 모델에서도 토큰화된 단어를 작은 문자 시퀀스로 분류를 진행하여

반복되는 단어에 확률 점수를 매기는 방식으로 진행된다고 합니다.

AI에서 중요한 부분인 정확성을 확보하기 위해서

방대한 양의 텍스트 말뭉치로 LLM을 학습한다고 합니다.

주요 구성요소

방대한 양을 학습하고, 입력 데이터를 분석하여 예측 결과를 내보내는 과정이라고 생각하시면 될 것같습니다.

컴퓨터에게 텍스트를 이해시키는 과정이 어려웠지만,

LLM의 등장으로 이해시키는 과정이 쉬워지고 정확도도 높아져서 NLPL 분야가 한층 성장했다고 합니다.

이렇게 기술적으로 발전할 수 있는 기반을 만들어 주고 있지만,

여러 문제점도 발생하고 있습니다.

LLM 뿐만 아니라, AI 분야에서 발생하는 문제점들도 몇가지 보이는 것 같습니다.

오늘은 LLM에 대해서 정말 간단하게 알아보았습니다.

공부할게 계속나오네...ㅎㅎㅎ

[We-Co] 텍스트 유해성 검사하기 - smilegate-ai with Python (0)	2024.07.26
[AI] Hello GPT-4o ! - GPT-4o 출시 (1)	2024.05.14
[Data] EDA - 데이터의 기본(탐색적 데이터 분석) (0)	2024.04.30
[MySQL]mysqldump - dump file 생성하고 백업 및 복원을 해보자! (1)	2024.04.17
[Docker] docker cp - 컨테이너와 파일을 주고받아보자! (0)	2024.04.15