본문 바로가기

대규모 언어 모델1

LLM(Large Language Model, 대규모 언어 모델) 대규모의 텍스트 데이터를 학습하여 자연어 이해와 생성 작업에 탁월한 성능을 보이는 심층 신경망(deep neural network) 모델. 대규모 언어 모델(LLM: Large Language Model)은 대규모 텍스트 데이터세트를 활용하여 학습한 파라미터의 수가 매우 큰 모델로 문장을 이해하거나 새로운 텍스트를 생성하는 데 사용한다. 대규모 언어 모델은 수십억에서 수조 개의 파라미터를 포함하고 있어서 과적합(overfitting)을 방지하고 우수한 성능을 달성하기 위해 대규모 데이터세트로 훈련되어야 한다. 대규모 언어 모델에 사용되는 학습 데이터세트로는 인터넷상에 존재하는 방대한 양의 책, 기사, 웹 사이트 등이 있다. 이들 데이터는 일반적으로 데이터 수집(collection), 정제(cleansin.. 2025. 4. 1.

이전 1 다음

티스토리툴바