본문 바로가기
Statistics (통계)

[통계] Conditional Probability (조건부 확률)과 LLM

by muha0-0 2025. 9. 7.

조건부 확률의 정의는 (Conditional Probability) 한 사건이 일어났다는 전제 하에서 다른 사건이 일어날 확률이다. 기호로는 P(A|B)로 표기한다. A가 일어날 확률에서 B가 일어날 확률은 A가 일어난 상황으로 '한정'하기 때문에 A가 일어난 상황이 Sample Space (분모, 전체집합)으로 바뀐다고 이해하면 쉽다. 조건부 확률 공식은 두 사건 중 하나가 서로 영향을 미치는 종속 관계에 있을 때 뿐만 아니라, 독립적 관계일 때에도 적용할 수 있다. 

 

P(BA)=P(AandB)/P(A) or P(BA)=P(AB)/P(A) = A가 발생했다는 전제 하에 B가 발생할 확률 

Where:

  • P = Probability
  • A = Event A
  • B = Event B

 

조건부 확률은 GPT와 같은 LLM의 개발과 기능에 핵심적인 역할을 한다. LLM 모델은 앞에 나온 단어 혹은 맥락에 기초에 다음에 나올 단어를 예측한다. 따라서 조건부 확률은 LLM 개발시 아래와 같이 사용된다. 

  • Token Prediction: 앞선 토큰의 순서에 따라 다음에 나올 토큰의 확률을 예측한다. 모델은 각각 토큰이 나올 확률을 계산한다.
  • Sequence Generation: LLM은 조건부 확률에 따라 텍스트를 순차적으로 생성한다. 그 순간까지 생성된 토큰 시퀀스 (Token Sequence) 다음 토큰 "X"가 나올 확률 분포를 아래와 같이 계산한다 : P(xtx1,x2,,xt1). 이는 지금까지의 문맥(Context)에 따라 가능한 모든 토큰 후보 각각의 조건부 확률을 의미합니다. 그리고 이 분포에서 샘플링하여 다음 토큰을 선택합니다.