[생성형 AI(Generative AI), 인간의 창작 영역을 넘본다! (11)] OpenAI가 출시한 GPT-4, 냉장고 내용물 이미지 제공하면 재료 사용한 요리법 알려줘!

최봉 산업경제 전문기자 입력 : 2023.03.21 00:30 ㅣ 수정 : 2023.03.21 00:30

[기사요약]
OpenAI, 지난 3월 14일 대규모 언어 모델의 최신 버전인 GPT-4 발표
이전 버전과 달리 GPT-4 훈련 관련 세부 정보 공개하지 않아
GPT-4, 많은 전문 테스트에서 ‘인간 수준의 성능’ 보인 것으로 알려져
텍스트와 이미지 모두에 응답할 수 있는 ‘다중 모드 대규모 언어 모델’
여전히 이전 GPT 모델과 유사한 한계는 남아, OpenAI도 아직 완벽하지 않음 인정

  • 카카오스토리
  • 네이버밴드
  • 페이스북
  • 트위터
  • 글자크게
  • 글자작게

사람들은 시, 소설, 보고서 등 글쓰기, 그림 그리기, 알고리즘 코딩 등 창작의 세계가 그동안 인간에게만 허락된 별도의 영역이라 알고 있었다. 그런데 AI(인공지능)의 발전과 함께 이제는 진화한 AI가 스스로 창작의 영역을 넘보는 시대가 되었다. 생성형 AI(Generative AI)의 등장은 인간에게 어떤 의미가 있으며 우리의 미래에 어떤 영향을 미칠지 가늠하기 쉽지 않지만, 생성형 AI는 이미 여러 분야에서 현실로 나타나 적용되고 있다. 우리에게 성큼 다가온 생성형 AI의 시장현황, 다양한 이슈와 관심 사항 등을 살펴보기로 하자. <편집자 주>

 

image
[출처=Getty Images]

 

[뉴스투데이=최봉 산업경제 전문기자] GPT(Generative Pretrained Transformer)는 딥 러닝을 사용하여 인간과 유사한 텍스트를 생성하는 일종의 대규모 언어 모델(LLM)이다.

 

ChatGPT의 개발사인 OpenAI가 2018년 GPT-1을 출시한 이래 지속적으로 업그레이드 하여  2022년 11월 베타버전인 GPT-3.5가 시장에 소개되면서 세계적으로 큰 반향을 일으켰다.

 

GPT-4에 앞서 테스트 버전으로 공개된 것이 GPT-3.5인데 최근 센세이션을 일으키고 있는 ChatGPT가 GPT-3.5에서 실행되고 있기 때문이다.

 

필자의 본 시리즈 5편(AI 학습 데이터 크기, “더 클수록 더 좋다?”, 1월 31일)에서 “GPT-4는 올해 안에 공개될 것(확실한 공개일정은 아직 미정이지만)으로 내다보고 있다”고 언급한 바 있다.

 

image
OpenAI의 4명의 관계자가 노트북을 바라보고 있다. 왼쪽이 CEO인 샘알트만(Sam Altman)이다. [출처=New York Times]

 


• OpenAI가 GPT-4 출시, 관련 세부 정보는 공개하지 않아

 

하지만 이 같은 예상보다 훨씬 빨리 OpenAI는 지난주(3월 14일) 대규모 언어 모델의 최신 버전인 GPT-4를 발표했다. GPT-4는 이전 버전보다 “더 크다”, 즉 더 많은 데이터로 훈련되었다고 예상한다.

 

OpenAI는 마이크로소프트 애저(Azure)를 사용하여 모델을 훈련했는데, 얼마나 더 크고 왜 더 나은지는 공개하지 않고 있다.

 

OpenAI는 ‘경쟁 환경’을 언급하면서 모델을 재생성하는 데 사용할 수 있는 특정 모델 크기나 훈련에 사용한 하드웨어에 대한 세부 정보를 게시하지 않았다.

 

GPT-4는 OpenAI가 내놓은 가장 비밀스러운 출시로, 일부 전문가들은 조만간 OpenAI가 비영리 연구소에서 영리 기술 회사로의 완전한 전환을 선언할 것으로 내다보고 있다(“GPT-4 is bigger and better than ChatGPT-but OpenAI won’t say why”, Technology Review, 2023.3.14).

 

image
[출처=Financial Times]

 


• 다중 모드 응답 가능하고, 전문 테스트에서 ‘인간 수준의 성능’ 보여

 

GPT-4에 대해 OpenAI는 많은 전문 테스트에서 ‘인간 수준의 성능’을 보인다고 밝혔다.

 

GPT-4는 모의 변호사 시험에서 90번째 백분위수(ChatGPT는 10번째 백분위수), 생물학 올림피아드에서 99번째 백분위수(ChatGPT는 31번째 백분위수)를 보여 인간에게 시행하는 테스트에서 최상위의 성적을 기록했으며, ChatGPT를 능가하는 수준을 보여주었다고 한다.

 

또한 SAT 읽기 시험에서 93번째 백분위수, SAT 수학 시험에서 89번째 백분위수를 기록했다고 OpenAI는 밝혔다.

 

또다른 특징으로, GPT-4는 이미지 및 텍스트 입력이 가능하고 텍스트 출력을 생성할 수 있는 ‘다중 모드 대규모 언어 모델(multimodal large language model)’이다. 즉 텍스트와 이미지 모두에 응답할 수 있음을 의미한다.

 

예를 들면, 냉장고에 있는 내용물의 사진을 제공하고 무엇을 만들 수 있는지 물어보면 GPT-4는 사진에 있는 재료를 사용하는 요리법을 찾아내려고 노력한다.

 

image
[출처=academyofmine]

 

OpenAI는 GPT-4를 더 안전하고 정확하게 만드는 데 5~6개월이 걸렸다고 말한다. 회사에 따르면 GPT-4는 GPT-3.5보다 OpenAI가 허용하지 않는 콘텐츠 요청에 응답할 가능성이 82% 낮고 구성할 가능성이 60% 낮다고 한다.

 


• GPT-4 아직 완벽하지 않지만, 인간의 능력 추월하는 영역 점차 늘어날 것

 

‘인간 수준의 성능’을 보인다는 GPT-4이지만 아직도 이전 GPT 모델과 유사한 한계는 남아있다.

 

여전히 사실을 ‘환각(hallucinate, 거짓을 참인 것처럼 말함)’하고 추론 오류를 만들 수 있으므로, 특히 고위험 상황에서 언어 모델 결과를 사용할 때 주의해야 한다.

 

또한 GPT-4는 2021년 10월 이후의 사건에 대해 알지 못하므로(그 시점까지의 데이터 세트를 기반으로 훈련되었기 때문) 단순한 추론 오류를 만들고 거짓 진술을 사실로 받아들일 수 있다.

 

실제로 OpenAI도 새 소프트웨어가 아직 완벽하지 않으며 많은 시나리오에서 인간보다 능력이 떨어진다고 경고하고 있다.

 

GPT-4는 지금까지 구축된 최고의 다중 모드 대규모 언어 모델일 수 있다. 그러나 GPT-3가 2020년에 처음 등장했을 때처럼 “그들만의 리그”가 아니다. 지난 3년 동안 많은 일이 일어났다. 그만큼 상황이 녹록지 않다는 것을 의미한다.

 

image
[출처=the-decoder]

 

오늘날 GPT-4는 DeepMind의 Flamingo를 비롯한 다른 다중 모드 모델과 경쟁해야 한다. 또다른 경쟁자인 Hugging Face는 일반 사람들이 자유롭게 사용하고 적용할 수 있는 오픈 소스 다중 모드 모델을 이미 운영하고 있다.

 

OpenAI 스스로도 인정했듯이 GPT-4는 여전히 인간보다 능력이 떨어질 수 있다. 하지만 인간의 능력을 추월하는 영역이 점차 늘어나고 있음에 따라, 많은 분야에서 AI가 인간을 지배하는 날이 다가오는 것 같아 두렵다.

 

 


 

image

댓글 (0)

- 띄어 쓰기를 포함하여 250자 이내로 써주세요.

- 건전한 토론문화를 위해, 타인에게 불쾌감을 주는 욕설/비방/허위/명예훼손/도배 등의 댓글은 표시가 제한됩니다.

0 /250