대화형 인공지능(AI) 챗GPT를 개발한 오픈AI는 13일(현지 시각) 신형 AI GPT-4o를 개발했다고 밝혔다. 오픈AI에 따르면 GPT-4o는 이전 제품에 비해 처리 속도를 2배로 높였다. 사람 음성으로 말을 걸면 사람과 같은 반응 속도로 대화를 나눌 수 있다.
약점이었던 반응 지연을 극복해 AI 활용이 더욱 확산될 것으로 보인다. 'GPT-4o'는 챗GPT를 움직이는 기초가 되는 기술로, 2023년 11월 발표한 현행 'GPT-4' 이후 처음 나온 혁신이다. o는 '모든'과 ‘무한’을 의미하는 'omn'의 앞 글자에서 따왔다.
새로운 AI는 한국어를 포함한 50개 언어를 지원하며 문자, 이미지, 음성을 모두 인식한다. 실시간 번역 외에 스마트폰 카메라를 이용해 사람의 얼굴 표정을 읽거나 그래프를 읽을 수도 있다. GPT-4o의 음성 반응 속도는 빠른 경우 232밀리초(1000분의 1초), 평균 320밀리초로 사람이 실제로 대화할 때와 같은 수준을 구현했다.
인간의 감정을 읽고 농담도 서로 통한다. 보다 자연스러운 대화가 가능해졌다. 이날 열린 웹 발표회에서는 개발자가 음성으로 챗GPT에게 잠자기 전 이야기를 읽어달라고 요청하자 GPT-4o는 목소리의 톤을 바꿔가며 노래하거나 책을 읽는 등의 조작을 선보였다.
밀라 무라티 최고기술책임자(CTO)는 발표회에서 "지금까지는 AI 모델의 지능을 높이는 데 주력해 왔지만, 이번엔 사용 편의성에서 더 큰 전진을 이뤘다"고 말했다. 신기술 탑재 후에도 챗GPT의 사용 요금은 바뀌지 않는다. 텍스트나 화상 전용의 일부 기능은 무료로 사용할 수 있다.
음성을 사용한 기능은 월 20달러의 요금 이용자가 몇 주 이내에 사용할 수 있도록 조치할 예정이다. 생성형 AI는 구글의 제미나이 1.5 Pro와 스타트업 앤솔로픽이 개발한 Claude(클로드) 3, 메타의 Llama(라마) 3 등 새로운 제품이 잇달아 출시되면서 성능 경쟁이 뜨거워지고 있다.
오픈AI는 정밀 동영상을 만드는 생성형 AI ‘소라(Sora)’도 개발하고 있다. AI가 처리할 수 있는 정보량과 종류를 늘리고 있으며, 처리 속도를 빠르게 해 사용 편의성을 한층 더 높임으로써 1억 명 이상이 이용하는 챗GPT 서비스로 더욱 입지를 다져나갈 예정이다.
성일만 글로벌이코노믹 기자 texan509@g-enews.com