GPT-3 능가하는 한국어 AI 모델개발 위해 '네이버·서울대' 손잡아

양대규 기자 입력 : 2021.05.10 11:24 ㅣ 수정 : 2021.05.11 14:59

네이버·서울대, AI 연구센터 설립...100여명 연구원 참여·수백억원 투자

  • 카카오스토리
  • 네이버밴드
  • 페이스북
  • 트위터
  • 글자크게
  • 글자작게
image
(왼쪽부터) 협약식에 참석한 하정우 AI LAB 소장, 최인혁 네이버 COO, 정석근 클로바 CIC 대표 (모니터 속 서울대학교 AI 연구원 장병탁 원장, 전병곤 부원장, 함종민 산학협력센터장). [사진=네이버]

 

[뉴스투데이=양대규 기자] 한국어판 GPT-3 개발이 드디어 눈앞으로 다가왔다. 네이버가 최근 서울대학교와 함께 손을 잡고 GPT-3를 능가하는 초대규모 인공지능(AI) 모델을 개발하기로 했기 때문이다.

오픈AI에서 개발한 GPT-3는 지난해 공개된 이후 트위터에 글을 쓰고 전문적인 질문에 답하고 스스로 코딩을 하는 AI로 전 세계의 이목을 집중시켰다.

 

GPT-3가 이런 성능을 보일 수 있는 것은 초대규모(하이퍼스케일) 데이터를 이용했기 때문이다. GPT-3는 175억개 파리미터, 5000억개 단어를 학습해 이같은 성능을 발휘했다. 이를 위해 1만개 이상 그래픽처리장치(GPU)를 사용했다.

 

아쉬운 점은 한국어 지원이 미흡하다. 대부분 데이터가 영어를 기반으로 했기 때문이다.

 

하정우 네이버 AI연구소장은 "GPT-3가 사용한 데이터에서 92.7%가 영어”라고 설명했다. 

 

이에 하정우 연구소장은 한국어판 GPT-3 개발이 필요하다며 AI 연구를 위한 국내 연구자들의 연대를 꾸준히 강조했다.

 

그 결과, 네이버와 서울대학교는 10일 초대규모 AI 공동연구를 위한 협약을 온라인으로 체결했다.

 

​네이버와 서울대는 ‘초대규모 AI’ 분야에서 공동 연구를 수행하기 위해, ‘서울대-네이버 초대규모 AI 연구센터'를 설립한다. 전병곤 서울대 교수와 하정우 네이버 AI LAB 소장이 공동센터장을 맡는다.

 

네이버와 서울대 AI 연구원 100여명이 참여하며, 3년간 연구비, 인프라 지원비 등을 포함해 수백억원 규모의 투자가 진행된다.

 

이를 통해 초대규모 한국어 언어모델을 더욱 발전시키고,언어, 이미지, 음성을 동시에 이해하는 초대규모 AI를 함께 개발하겠다는 것이 목표다. 한국어판 GPT-3의 실현이 눈앞으로 다가 왔다는 것.

 

지난해 12월  하 소장은 GPT-3 개발을 위해 "네이버 연구자뿐만 아니라 AI 대학원 연구자도 함께 이 문제를 해결해 한국어 AI R&D 이니셔티브 형태로 함께 이 문제를 파보고 가치를 만들어내면 임팩트있는 연구, AI 주권 관점에서도 글로벌에 밀리지 않는 오너십을 가지게 될 것으로 생각한다"고 밝힌 바 있다.

 

네이버는 보유한 슈퍼컴퓨팅 인프라와 데이터를 공동 연구센터에서 활용할 수 있도록 공유한다. 네이버는 작년 10월 국내 기업 최초로 초거대 언어모델 구축을 위해 슈퍼컴퓨터를 도입했다. 연구 성과는 연 2회 이상 기술 공유 워크숍을 개최하는 등 적극적으로 공유할 계획이다. 

 

네이버 최인혁 COO는 “네이버와 서울대의 연구진들이 함께 만들어낼 강력한 연구 시너지가 기대된다”며 “네이버 인프라와 데이터, 양측의 연구 역량이 합쳐진 공동 AI 연구센터를 통해, 글로벌 경쟁자들에 맞서 초대규모 AI 분야의 연구를 선도하겠다”고 강조했다. 

 

장병탁 서울대학교 AI 연구원장은 “AI 분야에서 혁신적인 연구를 하려면 인프라와 인력이 모두 중요하다”며, “네이버의 우수한 인프라와 양측의 AI 인재들이 힘을 합쳐 글로벌 경쟁력을 갖춘 AI를 개발할 수 있다고 확신한다”고 말했다.

댓글 (0)

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.

- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

0 /250