문돌이 존버/Speech&Language Processing
2020. 12. 28.
비전공자 문돌이가 설명해주는 MFCC 벡터(vector) 2탄
지난 시간에 이어 MFCC 벡터 2탄입니다. 우리는 소리(관찰값)를 듣고 이것의 근원인 단어들의 조합, 즉 문장을 알고 싶다고 이야기했습니다. 식으로 나타내면 아래와 같이 표현할 수 있었습니다. O는 observation의 이니셜, W는 words의 이니셜입니다. $\hat{W}=argmax\underset{W} P(W|O)$ 위의 식을 풀려면 베이지안 룰을 사용해야 함을 기억하실 겁니다. 우리에게는 학습 과정을 통해 얻은 확률값 P(W), P(O|W)가 있기 때문에 아래의 식처럼 P(W|O)를 구할 수 있죠. 저번에도 말씀드렸듯이, P(O)는 이미 관찰한 값으로 상수로 처리되기 때문에 최댓값을 구하는 데 아무런 영향을 끼치지 않습니다. 즉 "I love you"라는 문장이 들렸고, 이에 해당하는 sou..