문돌이 존버/Speech&Language Processing
2020. 11. 21.
비전공자 문돌이가 설명해주는 MFCC 벡터(vector) 1탄
이번 시간에는 아마도 많이 들어보셨을 것이라 생각되는, 음성인식 분야에서 매우 유명한 MFCC(Mel-Frequency Cepstral Coefficients) 벡터에 대해 설명드리려고 합니다. 마찬가지로 가장 기본적인 내용만 설명할 것이고 수식은 최대한 배제하는 방향으로 진행하겠습니다. 현실 세계에서 발생하는 소리는 그 원본 자체가 그대로 깨끗하게 상대방에게 전달되지 않습니다. 내 목소리에서 나온 소리는 일종의 소음(=noise, 이하 노이즈)이 끼게 되죠. 컴퓨터에 입력되는 소리는 더더욱 노이즈가 많습니다. 마이크로폰을 통해 전달되는 소리, 수화기 너머 들리는 소리 등은 엄밀히 말해 원본 소리와 다른 소리입니다. 이렇게 노이즈가 많이 있다 하더라도 우리의 목표는 원본 소리를 최대한 알아차리고 이해하여..