[통계] Conditional Probability (조건부 확률)과 LLM

조건부 확률의 정의는 (Conditional Probability) 한 사건이 일어났다는 전제 하에서 다른 사건이 일어날 확률이다. 기호로는 P(A|B)로 표기한다. A가 일어날 확률에서 B가 일어날 확률은 A가 일어난 상황으로 '한정'하기 때문에 A가 일어난 상황이 Sample Space (분모, 전체집합)으로 바뀐다고 이해하면 쉽다. 조건부 확률 공식은 두 사건 중 하나가 서로 영향을 미치는 종속 관계에 있을 때 뿐만 아니라, 독립적 관계일 때에도 적용할 수 있다.

P(B∣A)=P(AandB)/P(A) or P(B∣A)=P(A∩B)/P(A) = A가 발생했다는 전제 하에 B가 발생할 확률

Where:

P = Probability
A = Event A
B = Event B

조건부 확률은 GPT와 같은 LLM의 개발과 기능에 핵심적인 역할을 한다. LLM 모델은 앞에 나온 단어 혹은 맥락에 기초에 다음에 나올 단어를 예측한다. 따라서 조건부 확률은 LLM 개발시 아래와 같이 사용된다.

Token Prediction: 앞선 토큰의 순서에 따라 다음에 나올 토큰의 확률을 예측한다. 모델은 각각 토큰이 나올 확률을 계산한다.
Sequence Generation: LLM은 조건부 확률에 따라 텍스트를 순차적으로 생성한다. 그 순간까지 생성된 토큰 시퀀스 (Token Sequence) 다음 토큰 "X"가 나올 확률 분포를 아래와 같이 계산한다 : P(xt∣x1,x2,…,xt−1). 이는 지금까지의 문맥(Context)에 따라 가능한 모든 토큰 후보 각각의 조건부 확률을 의미합니다. 그리고 이 분포에서 샘플링하여 다음 토큰을 선택합니다.

https://recipesds.tistory.com/entry/%EC%95%8C%EA%B2%8C%EB%90%98%EB%A9%B4-%EC%82%AC%EB%9E%91%EC%8A%A4%EB%9F%AC%EC%9A%B4-%EC%A1%B0%EA%B1%B4%EB%B6%80-%ED%99%95%EB%A5%A0

'Statistics (통계)' 카테고리의 다른 글

[통계] Multiple Linear Regression (MLR, 다중 선형 회귀분석) (0)	2025.10.10
[통계] 베이즈 확률론 (Bayesian Probability) 기본 (0)	2025.09.08
[강의 추천] Coursera - The Power of Statistics (2)	2025.09.01
[통계] 산술평균, 기하평균 with python (1)	2025.08.31
[통계] 표준편차 (Standard Deviation) 분산 (Variance) 개념과 한계 (0)	2025.08.31

므하의 제품 기획장

[통계] Conditional Probability (조건부 확률)과 LLM

'Statistics (통계)' 카테고리의 다른 글

티스토리툴바

[통계] Conditional Probability (조건부 확률)과 LLM

'Statistics (통계)' 카테고리의 다른 글

관련글

티스토리툴바