Zorba blog
화자 식별(Speaker Identification), 화자 검증(Speaker Verification) 본문
화자 인식(Speaker Recognition) 기술은 아래 두 가지로 나누어집니다.
1) 화자 식별(Speaker Identification)
- 주어진 발언으로부터 해당하는 화자(인물)을 찾아내는 기술
- 등록된 N명의 화자 중 가장 유사한 1명을 찾는 기술.
- 유사도를 계산하여 가장 높은 유사도를 가진 화자를 선택.
- 미등록 화자를 거부하는 문제는 다루지 않고, 미등록 화자의 경우 식별을 실패한다는 문제가 있음.
2) 화자 확인, 검증(Speaker Verification)
- 주어진 발언이 시스템에 등록된 사용자들의 목소리 중에 있는지 검증하는 기술.
- 지정된 대상 화자가 맞다면 승인
- 유사도 점수가 임계치 이상이면 승인.
문장 종속(Text Dependent)
- 등록 / 테스트 발성의 내용이 동일
- 상대적으로 높은 정확도를 내기 쉬움
- 예를들어, "안녕 클로바" 라고 등록을 미리 해두고, 나중에 "안녕 클로바" 라고 말해야 인증이 되는 방식.
문장 독립(Text Independent)
- 발성 내용에 무관하게 인식.
- 상대적으로 높은 정확도를 내기 어려움.
추후에 다시 조사할 예정.
참고자료
1. 화자인식 기술 및 관련 연구 소개
https://www.youtube.com/watch?v=HzgCnlre4EE
Comments