Comparative study of Korean speech recognition based on SpecAugment and Kaldi (HCLT 2021)

Annual Conference on Human and Language Technology (HCLT)

Authors

  • Seounghoon Lee, Chanjun Park, Jaehyung Seo, Gyeongmin Kim, Heuiseok Lim

Abstract

Kaldi는 음성인식 오픈소스 플랫폼이며 많은 기업에서 이를 이용하여 비즈니스 및 연구를 진행하고 있다. 그러나 국문으로 된 Kaldi 에 대한 자세한 모듈 설명과 활용법은 아직 미비한 실정이다. 본 논문은 음성인식 오픈소스인 Kaldi 에 대한 각 모듈별 자세한 설명과 더불어 데이터 증강 기법인 SpecAugment 를 한국어 음성인식 시스템에 적용하여 성능 향상 여부를 검증하였다. 그리고 Kaldi 의 음향모델과 언어모델을 변경하면서 어떠한 모듈들로 구성된 한국어 음성인식 모델을 사용하는 것이 가장 결과가 좋은 지를 검증하고 실시간 디코딩에 있어서 실용적인지를 비교하였다.

Check out the This Link for more info on our paper.