영단어 처리능력 8배 증가, 이미지인식 가능...'인간평균수준' 근접
신뢰성 제고 등 아직 넘어야할 산 많아...경쟁업체들 개발경쟁 격화
| ▲생성형 AI 언어모델 GPT-4를 공개하며 글로벌 AI시장을 견인하고 있는 오픈AI. <사진=연합뉴스제공> |
전 세계에 AI(인공지능) 열풍을 몰고온 생성형 AI '챗GPT'(GPT-3.5)가 한층 더 진화한, 훨씬 똑똑해진 모습으로 새롭게 탄생했다. 챗GPT 개발사 미국 오픈AI가 새로운 AI 언어모델 ‘GPT-4’를 전격 공개한 것이다.
오픈AI가 작년말 인간의 지적 수준에 한발 더 다가선 'GPT-3.5'버전을 내놓으며 세상을 깜짝놀라게한 지 4개월만의 훨씬 더 똑똑해진 업그레이드 버전을 발표했다.
오픈AI에 따르면 GPT-4의 지적 능력은 인간의 평균 수준에 근접한다. 미 대학입학수학능력평가인 SAT와 변호사시험 등 일부 전문지식과 방대한 정보를 요하는 분야에선 상당한 수준에 도달했음을 증명해냈다.
갈수록 진화의 속도를 더하는 챗GPT에 의해 전 세계는 AI블랙홀에 빠져들 조짐이다. 대기업과 벤처기업, 스타트업 할 것 없이 AI기술개발에 뛰어들고 있다. 첨단기술의 헤게모니를 잡기위한 패권 전쟁에 돌입한 세계 주요 각국 정부도 AI 지원정책에 역량을 집중하고 있다.
■ GPT-4, 얼마나 어떻게 진보됐나
모든 소프트웨어 및 솔루션의 버전 넘버는 그 자체의 레벨을 의미한다. 소숫점 이하가 아닌 앞의 숫자가 커진 것은 레벨이 한단계 발전했다는 뜻이다. 오픈AI의 GPT의 버전 숫자를 종전 GPT-3.5에서 3.3X 가 아닌 GPT-4로 붙은 것은 그만큼 크게 진화한 버전임을 강조한 것이라는 얘기다.
오픈AI는 2020년 GPT-3를 세상에 내놓은 이후 진화를 거듭하며 약 3년 만에 '버전 4'의 시대를 열게됐다. 그런만큼 GPT-4는 여러면에서 종전 버전에 비해선 비약적 발전을 이뤄냈다는 평가를 받는다.
우선 언어 처리 능력이 급성장했다. GPT-4는 한꺼번에 처리할 수 있는 영어 단어 처리 능력이 2만5천개에 달한다. 기존 3천개에서 무려 8배가 증가한 것이다. 이 쯤되면 언어 능력 만큼은 왠만한 미국인에 버금가는 수준이다.
텍스트 기반이었던 전 버전과 달리 GPT-4는 이미지 인식이 가능해졌다. 이미지 속에 있는 각 객체를 인식하고 이에 대한 물음에 해법을 내놓는다. 그림을 보고 이해한다는 뜻이다. 예컨데, 쌀을 보여주고 무엇을 만들수 있냐고 물어보면 밥이나 떡의 레시피를 제안한다. 읽고 쓸 수는 이미지를 처리하진 못하는 한계를 극복한 것이다.
전문가들은 GPT-4가 멀티 모달 인공지능에 한 걸음 다가섰다고 평가한다. 사용자와 AI가 상호 작용을 하는 도구를 모달리티라고 하는데, 이 객체 수가 여러개인 경우 멀티 모달이라고 한다.
지적 능력도 크게 향상됐다. 다양한 전문적인 시험과 벤치마크에선 인간 수준의 성능을 발휘한다. 많은 전문적인 시험에서 인간 수준의 능력을 보여준다. 오픈AI에 따르면 미국 모의 변호사시험에선 90번째, 대입 자격시험인 SAT 읽기와 수학시험에서는 각각 93번째와 89번째의 백분위 수를 기록했다. GPT-4의 지적수준이 상위 10% 이내에 들어간다는 의미다.
오픈AI 측은 “GPT-4는 실제 시나리오에서 아직 인간에 비해 떨어지지만, 지난 6개월간 챗GPT를 통한 경험으로 역대 최고 수준의 지적능력을 증명했다"고 설명했다.
■ 부정확하고 편향적 답변 등 근본문제 해결 숙제
챗GPT의 한계점으로 간주됐던 ‘할루시네이션(환각·hallucinates) 효과', 즉 거짓을 진실로 받아들일 수 있는 부작용도 몰라보게 개선됐다. 오픈AI는 GPT-4가 팩트(사실)를 스스로 평가하는 능력을 40% 가량 강화했다고 밝혔다.
그럴싸한 문장으로 챗GPT를 속이는 것도 이젠 어느정도 걸러진다는 뜻이다. 실제 ‘폭탄을 어떻게 만들 수 있지?’와 같은 해로운 질문에 답변할 가능성이 82% 줄었다. 반면에 의학적 조언을 할 확률은 29%가량 늘었다는게 오픈AI측의 설명이다.
기억력도 높아졌다. GPT-3.5가 약 8천개의 단어를 기억했던 반면 GPT-4는 무려 6만4천개까지 기억해낸다. 기억능력이 책 4~5페이지에서 50페이지 정도로 늘어난 것이다. 이는 웬만한 단편소설을 통째로 기억하는 수준이다.
의도치 않은 발언을 유도하는 것도 예전처럼 쉽지 않아졌다. 지난 1~2년 동안 사용자들이 오픈AI에 제공한 수 많은 ‘악성 프롬프트(AI에 입력하는 명령어)’에 대해 학습을 거쳤기 때문이다. 오픈AI 측은 이와관련, “GPT-4는 ‘가드레일’ 밖으로 나가는 것을 거부하는 능력이 이전 보다 훨씬 향상됐다”고 자평했다.
지원하는 언어도 26개국어로 늘어났다. 전세계 언어를 거의 다 커버하게 된 셈이다. 그런가하면 스스로 추론하는 능력도 훨씬 좋아졌다. 가령 기존 시험에서 풀지 못한 문제도 풀수 있게 됐다.
이처럼 GPT-4가 이전 버전에 비해 장족의 발전을 이룬 것은 분명하지만, 아직도 넘어야할 산이 적지않다. 무엇보다 진화에 진화를 거듭했음에도, 사용자들에게 충분히 신회를 줄 수 없다는 한계를 완전히 극복하지는 못했다는 점이다. 신뢰성의 문제는 GPT-4와 같은 생성형 AI가 완전히 자리잡는 데 필요한 가장 기본적인 전제 조건이다.
오픈AI측도 이 부분은 어느 정도 인정한다. "부정확한 답변, 편향적 대답, 환각의 오류 등 이전 버전에서 노출된 문제를 GPT-4에서도 완전히 해결하지 못했다."는 게 그들의 자평이다. AI업계에서 "챗GPT가 6학년이라면, GPT-4는 똑똑한 10학년"이라며 GPT4가 아직은 초등학생 수준이라고 평가절하는 이유도 여기에 있다.
■ 글로벌 빅테크 기업간 AI 패권전쟁 치열
그러나, 챗GPT로 AI열풀을 일으킨 오픈AI가 한결 더 스마트해진 GPT-4를 출시함에 따라 글로벌 기업들의 AI 경쟁은 더욱 치열해질 것으로 예상된다. 무엇보다 AI패권을 잡기위한 미국의 글로벌 IT기업들간 경쟁이 한층 격화될 전망이다.
우선 MS와 구글, 두 공룡기업간의 자존심 싸움이 더 심화될 것으로 보인다. 현재까진 MS가 앞서있다. MS는 이미 2019년부터 오픈AI에 투자를 시작해 최근 100억 달러(13조원)로 추정되는 투자를 발표하며 AI시장의 리더로 자리를 굳혀가고 있다. MS는 내심 AI로 옛 영광을 되찾겠다는 심산이다.
| ▲'바드'로 GPT-4와 MS 따라잡기에 본격적으로 나선 구글. <사진=연합뉴스제공> |
챗GPT에서 GPT-4로 이어지는 MS의 움직임에 자극받은 구글은 AI부문에서 공격적인 움직임을 보이고 있다. 구글은 지난달 6일 챗GPT의 대항마로 초거대 언어 모델 LaMDA 기반 생성형 AI '바드(Bard)'를 내놨다. 바드는 시연에서 오답을 내놓아 구글의 체면을 구겼지만, MS를 따라잡기 위한 광폭 행보를 시작했다. 구글은 생성형 AI기술을 탑재한 제품을 대거 공개하며 거대 AI 생태계 확장에 박차를 가하고 있다.
네이버, 카카오 등 국내 빅테크 업체들도 다급해졌다. 한국어 능력을 더 높은 GPT-4의 등장과 구글의 광폭 행보로 자칫 거대시장으로 떠오를 것으로 전망되는 AI시장에서 낙오될 수 있다는 절박감이 커졌다.
특히 국내 플랫폼 시장을 양분하고 있는 네이버와 카카오 입장에선 생성형 AI를 앞세운 MS와 구글이 국내 플랫폼 시장의 뿌리를 흔들 수 있는 잠재적인 최대 경쟁자라 할 수 있다.
이에 따라 GPT-4와 바드의 행보를 예의주시하며 각각 한국어 특화 대규모 언어모델 개발에 더 집중한다는 전략이다. 이를 위해 네이버는 하이퍼클러바(HyperClova), 카카오는 KoGPT에 자본과 맨파워를 집중할 방침이다.
정부도 16일 GPT-4와 같은 생성형 AI의 더 나은 결과물을 도출하도록 돕는 직업인 '프롬프트 엔지니어' 육성에 나서겠다고 발표하는 등 국내 AI산업의 인프라와 생태계 확장을 위한 총력지원 태세에 돌입했다.
전세계에 불고 있는 AI패권전쟁에서 마지막에 웃는 자는 과연 누가될까. MS의 굳히기일까, 아니면 구글의 역전일까. 또한 이 과정에서 국내 빅테크업체들의 포지션은 어떻게 될까. GPT-4의 등장이 불이붙은 AI 해게모니 싸움에 기름을 부을 것으로 예상된다.
토요경제 / 이중배 기자 dialee09@naver.com
[저작권자ⓒ 토요경제. 무단전재-재배포 금지]




































