Yiksan0315's Blog

Bayesian Decision

# Tag:

  • Source/KU_ML

Bayesian Decision

어떠한 target function 를 학습한다고 했을 때, 는 알려지지 않은 변수라 우리는 알려진 변수 에만 의존하여 decision을 만들어야 한다.

이 때, Bayes' Theorem에 따라 더 Probability가 높은 쪽으로 decision 하는 것이 이상적이라 할 수 있으며, 이에 따라 분류하는 기법을 말한다.

상식적으로, posterior: 가 높은 쪽을 분류하는 것이 이상적이다.

  • : evidence, 관측한 증거
  • : prior, 사전 지식
  • : likelihood, 가 관측되었을 때 가 관측될 확률 혹은 가능성.

Bayesian Classification

Choose if

이 때, 에 대해 log를 취하거나 상수를 곱하거나 나누어도 동일하다. 이에 따라

를 선택한다.

Bayesian classificaiton using Gaussian Distribution

가장 큰 posterior를 지니는 class 를 찾는 문제로 변환되며, 가 포함되지 않은 항은 생략된다고 볼 수 있다.

Bayesian classification using [[../../../Mathematics/Probability/Distribution/Multivariate Distribution/MVN]]

아래와 같은 기법이 MVN classification을 위해 활용 가능하다.

  • QDA: Bayesian Decision에 기반한, MVN을 가정으로 하는 분류 기법.
  • LDA: Bayesian Decision에 기반하며, QDA와 비슷하지만 모든 class가 동일한 covariance matrix를 가진다고 가정한다.

RDA(regularized discriminant analysis**)

Covariance Matrix가 단순해질수록 계산 성능이 좋아진다. 적은 데이터에 대해서는 어느 정도 Covariance Matrix를 단순화해 사용 가능하므로 적절히 Cross Validation을 이용해 조정한다.

: 를 적절히 조절해 Covariance Matrix를 단순화한다.

Bayes Optimal classification

[[MAP]]에 따르면, 결국 Bayesian Estimation을 통한 최적의 parameter는 [[MAP]]를 통해 구한 로 결론지어진다.

그렇다면, Bayesian Estimation을 통한 optimal한 bayesian classification은,

: by chain-rule(Bayes' Theorem), 이 때, 를 알면 는 알 수 있으므로 depenent해 는 사라진다. : 에 관하여 는 무관하다.

이는 곧, 가 관측될(옳을) 확률 (를 조건으로 하는 에 대한 Expectation으로 해석할 수 있고, 이는 곧 Bayesian Estimation이다.

즉 optimal classification 방법은:

  • : for uniform prior
toc test

이 페이지는 리디주식회사에서 제공한 리디바탕 글꼴이 사용되어 있습니다. 리디바탕의 저작권은 리디주식회사가 소유하고 있습니다.

This Font Software is licensed under the SIL Open Font License, Version 1.1.

Copyright 2025. yiksan0315 All rights reserved.