Yiksan0315's Blog

NBC

# Tag:

  • Source/KU_ML

NBC(Naive Bayes' Classifier)

posterior가 큰 쪽으로 분류하는 Parametric Methods 일종인 classifier 방법. Bayesian Decision의 일종이다.

Inductive Bias: Train data 는 IID이다.

  • 해당 전제가 없다면, 미래의 결과를 예측할 수 없다.
  • IID이므로, 식은 : chain-rule, and Bayes' Theorem에 의해 likelihoodPrior의 곱으로 변한다. 를 따지는 것이므로, evidence를 생략해도 동일하다.

+) Prior는, 으로 계산된다.

How to get likelihood?

MLE에서 알려진 방법론을 이용한다.

만약 categorical distribution에 대한 NBC를 적용하는 것이라면,
: 임을 이용해 likelihood를 구할 수 있다.

Limitation of NBC

NBC의 한계는 명확히 존재하므로, 이를 해결하기 위한 방법들이 존재한다.

  • Probablity being zero: 와 같이 계산되므로, likelihood중 하나만 0을 가지더라도 전체 확률이 0으로 계산된다.
  • Discrete-valued input vectors: continiousRandom Variable의 vector등이 입력으로 들어오면 처리하지 못한다.
  • Inductive Bias에 의존: 만약 IID가 아닐 경우를 고려해야 한다.

M-estimate : Solution

Probablity being zero: 0이 되는 것을 방지하기 위한 방법.

이는 곧 MAP와 동일해진다.

  • : conditinal probablity의 추정치.
  • : weight to , 실제로는 관측하지 않았지만, 더 관측한다면 likelihood를 보완하는 어떠한 가 m의 비율로 존재할 것임을 의미한다.
toc test

이 페이지는 리디주식회사에서 제공한 리디바탕 글꼴이 사용되어 있습니다. 리디바탕의 저작권은 리디주식회사가 소유하고 있습니다.

This Font Software is licensed under the SIL Open Font License, Version 1.1.

Copyright 2025. yiksan0315 All rights reserved.