Bayes' Theorem과 Mahout를 활용한 스팸 필터링
1. Naive Bayes Classification Bayes' Theorem에 근거한 분류법이며, Bayes' Theorem은 조건부 확률에서는 새로운 정보를 알았을 때 확률의 개선이 일어나게 된다. 어떤 실험결과에서 나온 정보를 이용하여 어떤 사건의 처음 확률을 개선시킬 수 있는데, 여기서 처음 확률은 사전확률 (prior probability) 이라 하고, 개선된 확률을 사후확률 (posterior probability) 이라고 하며, 이러한 확률의 개선을 이루는 것이 베이즈의 정리 (Bayes' Theorem) 이다. 즉, 기존에 모아놨던 데이터에서 어떠한 인과관계를 분석하여 결과를 예측할 때 확률 Bayes' Theorem을 활용한다. 예를 들어 스팸 분류시 각각의 비아그라, 페니스, 대출 등..
AI
2016. 1. 19. 10:37