🧠 언어 모델(Language Model)이란 무엇인가요?
**언어 모델(Language Model)**은 머신러닝 기반의 인공지능 모델로, 사람의 말과 글을 예측하고 생성하는 것을 목표로 합니다.
쉽게 말하면, “다음에 어떤 말이 올지 가장 그럴듯한 답을 고르는 AI” 입니다.
🤖 언어 모델은 무엇을 배우는 AI일까?
언어 모델은 다음과 같은 일을 배우도록 훈련됩니다.
-
문장에서 **다음에 올 단어(또는 조각)**는 무엇일까?
-
이 문장이 자연스러운지 확률로 판단
-
여러 후보 중 가장 가능성 높은 표현 선택
👉 언어 모델의 핵심 목표는
**“자연스러운 언어를 만들어내는 것”**입니다.
✨ 우리가 이미 쓰고 있는 언어 모델 예시
언어 모델은 이미 일상 속에 있습니다.
-
스마트폰 자동 완성
-
검색창 추천 문장
-
이메일 문장 제안
👉 이런 기능들도 모두
언어 모델의 간단한 형태입니다.
🧩 언어 모델의 기본 단위: 토큰(Token)
언어 모델은 문장을 그대로 이해하지 않습니다.
대신 **토큰(Token)**이라는 단위로 나누어 처리합니다.
-
토큰 = 단어 또는 단어의 일부
-
문장 = 토큰들의 연속(시퀀스)
📝 예제로 이해하는 언어 모델의 작동 방식
다음 문장을 보겠습니다.
When I hear rain on my roof, I _______ in my kitchen.
언어 모델은
빈칸에 들어갈 수 있는 단어(또는 단어 묶음)의
확률을 계산합니다.
예를 들어 👇
👉 언어 모델은
**“가장 확률이 높은 표현”**을 선택합니다.
이 과정이 바로
👉 언어 생성(Language Generation) 입니다.
🔗 토큰 시퀀스(Token Sequence)란?
토큰 시퀀스란
-
하나의 문장
-
여러 문장
-
또는 긴 텍스트 덩어리
전체를 의미합니다.
모두를 확률의 연속으로 계산할 수 있습니다.
🎯 언어 모델이 할 수 있는 이유
언어 모델이 다음과 같은 일을 할 수 있는 이유는 모두 같습니다.
-
텍스트 생성
-
언어 번역
-
질문에 답하기
-
글 요약하기
👉 모두 **“다음에 올 토큰의 확률을 예측”**하는 문제이기 때문입니다.
⚠️ 꼭 알아야 할 중요한 사실
⭐ 핵심 정리
-
언어 모델은 머신러닝 기반 AI
-
목표는 자연스러운 언어 생성
-
토큰과 토큰 시퀀스로 문장을 처리
-
다음에 올 말의 확률을 계산
-
“이해”가 아니라 “예측”을 한다
댓글 쓰기