네이버, 음성인식 AI에 자기지도학습 기술 도입…초거대 AI 하이퍼클로바 이용
하이퍼 클로바로 정확도 30% 향상, 학습 시간 및 비용은 단축 / 클로바노트 서비스에 우선 탑재
[뉴스투데이=양대규 기자] 딥러닝(Deep Learning)은 수많은 빅데이터를 바탕으로 학습을 해 인공지능(AI) 성능을 발전시키는 대표적인 머신러닝(기계학습)기술이다.
최근까지 딥러닝 학습은 데이터와 데이터를 설명하는 '레이블(label)'을 함께 학습시키는 '지도학습(supervised learning)' 방식으로 진행됐다.
예를 들면 비행기의 사진과 그림에 '비행기'라는 텍스트 설명을 붙인 데이터를 AI가 학습하게 하는 것이다. 이런 수많은 데이터가 모이면 AI는 비행기를 더 잘 구분할 수 있다.
음성인식 AI 개발에는 이미지 대신 음성과 음성 속 텍스트를 같이 학습한다.
'데이터 레이블링'은 사람의 수작업으로 이뤄진다. 즉 학습데이터 구축에 시간과 비용이 많이 들 수밖에 없다.
최근에는 이를 극복하기 위한 '자기지도학습(self-supervised learning)'이 AI 개발의 새로운 방법론으로 제기되고 있다. 레이블 작업없이 데이터 자체만으로 학습할 수 있는 최신 딥러닝 기법이다. 학습의 효율성을 훨씬 높일 수 있지만 정확성을 높이기 위해서는 수많은 데이터가 필요하다.
국내에는 네이버가 최근 공개한 초대규모(hyperscale) AI '하이퍼클로바'에 자기지도학습을 도입해 AI 성능을 끌어올리고 있다.
최근 네이버는 이런 자기지도 학습 기반의 하이퍼클로바를 음성인식 AI 엔진에도 접목할 계획을 밝혔다.
8일 네이버는 '하이퍼클로바'의 딥러닝 기술을 음성인식 AI 엔진에도 접목해 성능을 대폭 강화했다고 밝혔다. 클로바노트, 클로바 케어콜 등 음성인식 AI를 활용한 여러 서비스에 업그레이드된 엔진을 탑재해 더욱 편리한 사용자 경험을 제공한다는 계획.
자기지도학습 기법을 AI 음성인식 엔진 'NEST(Neural End-to-end Speech Transcriber)'에 적용함해, 기존 대비 음성인식의 정확도를 약 30% 높였다고 네이버 측은 설명했다.
새로운 학습기법 적용으로 음원 데이터 속 텍스트를 확인하는 전사(transcription) 작업을 최소화하면서도 기존보다 정확한 AI 학습이 가능해졌다는 것. 모델의 학습 시간 및 비용도 획기적으로 단축됐다.
NEST 엔진은 단문 위주의 음성 명령보다 복잡한 장문의 음성 표현을 인식하는데 최적화된 기술로, 네이버가 지난해 4월 처음 공개했다.
업그레이드된 NEST 엔진은 먼저 '클로바노트'에 탑재됐다. 네이버가 작년 말 출시한 클로바노트는 사람의 말을 텍스트로 변환하는 STT(Speech to Text) 기능을 제공하는 음성기록 서비스다.
네이버 한익상 책임리더는 "네이버는 음성 AI 분야 양대 국제 학회인 'Interspeech'와 'ICASSP'에 올해 각각 9개씩의 논문이 채택되는 등 국내를 넘어 글로벌 최고 수준의 음성기술 경쟁력을 이미 인정받고 있다"며 "여기에 하이퍼클로바의 기술을 접목시킴으로써, 다양한 음성 AI 서비스의 성능을 더욱 고도화해나갈 것"이라고 말했다.
댓글 (0)
- 띄어 쓰기를 포함하여 250자 이내로 써주세요.
- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.