Bayesian Decision
# Tag:
- Source/KU_ML
Bayesian Decision
이 때, Bayes' Theorem에 따라 더 Probability가 높은 쪽으로 decision 하는 것이 이상적이라 할 수 있으며, 이에 따라 분류하는 기법을 말한다.
상식적으로, posterior: 가 높은 쪽을 분류하는 것이 이상적이다.
- : evidence, 관측한 증거
- : prior, 사전 지식
- : likelihood, 가 관측되었을 때 가 관측될 확률 혹은 가능성.
Bayesian Classification
Choose if
이 때, 에 대해 log를 취하거나 상수를 곱하거나 나누어도 동일하다. 이에 따라
인 를 선택한다.
Bayesian classificaiton using Gaussian Distribution
가장 큰 posterior를 지니는 class 를 찾는 문제로 변환되며, 가 포함되지 않은 항은 생략된다고 볼 수 있다.
Bayesian classification using [[../../../Mathematics/Probability/Distribution/Multivariate Distribution/MVN]]
아래와 같은 기법이 MVN classification을 위해 활용 가능하다.
- QDA: Bayesian Decision에 기반한, MVN을 가정으로 하는 분류 기법.
- LDA: Bayesian Decision에 기반하며, QDA와 비슷하지만 모든 class가 동일한 covariance matrix를 가진다고 가정한다.
RDA(regularized discriminant analysis**)
Covariance Matrix가 단순해질수록 계산 성능이 좋아진다. 적은 데이터에 대해서는 어느 정도 Covariance Matrix를 단순화해 사용 가능하므로 적절히 Cross Validation을 이용해 조정한다.
: 와 를 적절히 조절해 Covariance Matrix를 단순화한다.
Bayes Optimal classification
그렇다면, Bayesian Estimation을 통한 optimal한 bayesian classification은,
: by chain-rule(Bayes' Theorem), 이 때, 를 알면 는 알 수 있으므로 depenent해 는 사라진다. : 에 관하여 는 무관하다.
이는 곧, 가 관측될(옳을) 확률 (를 조건으로 하는 에 대한 Expectation으로 해석할 수 있고, 이는 곧 Bayesian Estimation이다.
즉 optimal classification 방법은:
- : for uniform prior