Multinomial Distribution
- or
- 다항 분포
# Tag:
Multinomial Distribution(다항 분포)
에 대해서, 개의 오브젝트를 개의 사건에 독립적으로 할당한다.
에 대해서, 오브젝트들은 각각 개의 카테고리로 분류된다. 은 번째 카테고리로 분류된 오브젝트의 개수이다(는 이항 분포를 따른게 된다). 그리고 는 각각 번째 카테고리로 분류될 확률이다. ()
Joint PMF
: (단, )를 번째 카테고리에 속한 오브젝트의 개수라고 할 때,
- 는 각 개수대로 카테고리로 분류될 확률이다.
- 는 개를 모두 순열처럼 배열한 뒤, 조합처럼 동일한 카테고리로 분류된 오브젝트들 간의 순열의 개수로 나누어주는 것과 동일하다. 즉, 일종의 조합이다.
Marginal PMF
의 주변 분포를 구하기 위해서는 번째 카테고리를 제외하고 모두 더해야 한다.
하지만, 개의 오브젝트가 번째 카테고리로 번의 독립적인 시행으로 의 확률로 분류 될지(성공), 분류 되지 않을지(실패) 결정되므로 이항분포라는 걸 알 수 있다. 따라서
Conditinal PMF
라는 조건으로 주어졌다고 가정했을 때의 조건부 PMF는,
그냥 로 생각하게 되면 그 합이 1이 되지 않으므로, 는 카테고리 1에 속하지 않는다는 조건이 주어졌을 때의 번째 카테고리에 속할 확률이다. 카테고리에 속하는 사건을 라 할 때,
Lumping Property(덩어리 특성)
하나의 확률 변수로 합친 카테고리의 확률은, 그 확률을 모두 더한 것과 같다.
일 때, 3부터 10까지의 카테고리를 합쳐서 만든 새로운 다항 확률 변수 는
Covariance
MultiNomial을 따르는 벡터의 원소들 간의 공분산 는,
원소들은 각각 이항 분포를 따르고, Lumping Property(덩어리 특성)에 의해 더해도 동일하게 이항 분포를 따르므로 아래와 같아진다.
따라서