메뉴 글로벌이코노믹 로고 검색
검색버튼

오픈AI 챗GPT "구글 제미나이 다시 추월"

올트먼 긴급 기자회견... 뉴욕증시 엔비디아 브로드컴 MS 환호
 오픈AI  새 버전 GPT-5.2 출시 구글 제미나이 다시 추월... 뉴욕증시  엔비디아 브로드컴  MS 환호  이미지 확대보기
오픈AI 새 버전 GPT-5.2 출시 "구글 제미나이 다시 추월"... 뉴욕증시 엔비디아 브로드컴 MS 환호
오픈AI 새 버전 GPT-5.2 출시 "구글 제미나이 다시 추월"... 뉴욕증시 엔비디아 브로드컴 MS 환호
구글의 추격을 받는 챗GPT 개발사 오픈AI가 이전 버전을 내놓은 지 불과 한 달 만에 새 버전 'GPT-5.2'를 내놨다.

오픈AI는 전문적인 지식 업무 수행에 가장 뛰어난 모델 GPT-5.2 시리즈를 출시한다고 11일(현지시간) 밝혔다.

GPT-5.2는 이전의 즉답(Instant), 사고(Thinking) 모드에 프로 모드를 더해 모두 세 가지 모드로 구성됐다.
즉답 모드는 일상적인 업무와 학습을 위한 빠른 답변에 최적화했고, 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다.

또 프로 모드는 보다 긴 작업시간을 필요로 하는 어려운 질문에 적합한 도구라고 오픈AI는 소개했다.

오픈AI는 새 버전이 추론과 코딩 능력을 강화하고 환각을 줄였으며, AI 성능을 측정하는 다양한 벤치마크에서 최고 수준을 달성했다고 강조했다.

전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나, 더 뛰어난 능력을 갖춘 것으로 평가됐다. 이전 버전인 GPT-5(38.8%)와 견줘 큰 폭의 성장을 보였다.
소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 80%를 기록해, 제미나이 3프로의 76.2%를 능가했다. 코딩 능력이 뛰어난 것으로 알려진 앤트로픽의 클로드 오퍼스4.5(80.9%)와 거의 차이가 없는 수준이다.

'인간의 마지막 시험'으로 불리는 박사급 추론능력 측정 벤치마크 HLE에서도 구글의 최신 AI 모델을 넘어섰다.

별도 도구를 사용하지 않고 모델 자체의 능력만으로 진행한 평가에서는 GPT-5.2 프로는 36.6%로 제미나이3 프로의 37.5%보다 소폭 낮은 평가를 보였지만, 검색 등 도구를 사용해서 진행한 평가에서는 50%로 제미나이3 프로(45.8%)보다 더 높은 점수를 얻었다.

환각(Hallucination) 현상도 크게 줄였다. 내부 테스트 결과 GPT-5.2 사고 모드의 오류율은 6.2%로 전작인 GPT-5.1 사고 모드(8.8%)와 견줘 약 30% 감소하는 등 신뢰도가 높아졌다고 오픈AI는 설명했다.
긴 글의 맥락을 파악하는 능력이나 그래프를 비롯한 그림과 사진을 인식하는 능력, 다단계 업무의 해결 능력 등도 향상됐다.

특히 오픈AI는 GPT-5.2에 정신건강을 비롯한 민감한 대화에서 응답 방식을 개선했고, 연령 예측 모델을 적용해 18세 미만 미성년자에 대한 콘텐츠 보호 기능을 적용하고 부모 통제 기능을 강화했다고 설명했다.

GPT-5.2는 유료 요금제 구독자에 이날부터 순차적으로 제공되며, 개발자들도 API를 통해 이용할 수 있다.

새 버전 출시에 따라 이전 버전인 GPT-5.1은 앞으로 3개월간 제공된 이후 서비스를 종료한다.

오픈AI가 불과 한 달 간격을 두고 챗GPT 새 버전을 내놓은 것은 지난 2022년 챗GPT 서비스를 시작한 이래 처음 있는 일이다.

오픈AI는 당초 GPT-5.2를 월말에 내놓으려 했지만, 제미나이3 프로가 강력한 벤치마크 성적표를 앞세워 이용자 몰이를 하는 것을 보고 출시를 앞당긴 것으로 전해졌다.

샘 올트먼 오픈AI 최고경영자(CEO)는 제미나이3 프로 출시 이후 사내에 중대경보(코드레드)를 발령하고 다른 일을 제쳐두고 챗GPT 성능과 사용성 개선에 집중하라고 주문한 바 있다.

오픈AI는 내년 1월에 또다시 새로운 모델을 선보인 이후 경보를 해제할 예정이라고 앞서 월스트리트저널(WSJ)이 보도한 바 있다.

인공지능(AI) 챗봇 챗GPT 개발사 오픈AI가 이용자의 망상을 부추겨 사망 사건을 일으켰다는 이유로 또 소송 대상이 됐다.

특히 이번 소송은 챗GPT가 개인의 극단적 선택뿐 아니라 살인까지 유도했다고 주장하는 첫 사례다.

미국 코네티컷주 그리니치에 거주하던 스타인-에릭 솔버그(56)와 노모인 수잰 애덤스(83)의 유족들은 오픈AI와 샘 올트먼 최고경영자(CEO), 마이크로소프트(MS) 등을 상대로 캘리포니아주 법원에 손해배상 청구 소송을 제기했다고 AP, 로이터, 블룸버그 통신 등 외신이 11일(현지시간) 보도했다.

경찰에 따르면 솔버그는 지난 8월 어머니인 애덤스를 교살한 뒤 자신도 극단적 선택으로 세상을 떠났다.

유족들은 소장에서 솔버그가 사건 이전 수개월 동안 챗GPT와 대화하며 심각한 망상에 빠졌는데, 이 과정에서 챗GPT가 이를 부추겼다고 주장했다.

소장은 "챗GPT는 신성한 목적을 위해 선택받았다고 솔버그를 추켜세웠다"며 "또 그를 돌보던 어머니를 적, 감시자, 프로그램된 위협으로 규정했다"고 비판했다.

소장에 따르면 챗GPT는 솔버그와의 대화에서 어머니의 프린터에서 불빛이 깜박이는 것은 감시장치이기 때문이라고 말하는가 하면, 어머니와 친구가 차량 환풍구를 통해 환각 물질을 유입시켜 중독시키려 한다는 망상에 동조하기도 했다.

이 과정에서 챗GPT가 정신 건강 전문가와 상담하라고 솔버그에게 제안한 적이 없다고도 소장은 적시했다.

실제로 솔버그가 사용한 챗GPT 모델 'GPT-4o'는 사용자에 맞춰 아부하거나 동조하는 경향이 강하다는 비판을 받아왔다.

오픈AI도 이와 같은 문제점을 인지하고 후속 모델인 'GPT-5'에서는 정신 건강 관련 대화에서 '바람직하지 않은 답변'을 39% 줄였다고 밝혔다.

유족들은 오픈AI가 충분한 안전성 검증 없이 모델을 출시해 이와 같은 비극을 초래했다고 비판했다.

고인의 아들인 에릭 솔버그는 성명에서 "이들 기업은 우리 가족을 영원히 바꿔놓은 자신들의 결정에 대해 책임을 져야 한다"고 주장했다.

특히 이들은 소장에서 올트먼 CEO가 안전팀의 반대를 무시하고 제품 출시를 강행했다고 지적하고, MS도 안전성 검사가 축소된 것을 알면서도 해당 버전의 출시를 승인했다고 비판했다.

오픈AI 대변인은 "매우 가슴 아픈 일"이라며 "세부 사항 파악을 위해 소송 내용을 검토하겠다"고 밝혔다.

그는 이어 "챗GPT는 정신적·정서적 고통의 징후를 감지하고 대화를 진정시키며 현실 세계의 도움을 받도록 유도하는 기능을 강화하고 있다"고 해명했다.

오픈AI가 정신건강 관련 문제를 일으켜 비극을 초래했다는 소송은 이번이 처음이 아니다.

캘리포니아의 16세 소년 애덤 레인의 유족은 챗GPT가 아들의 극단적 선택을 도왔다며 지난 8월 소송을 제기했고, 지난달에는 미국과 캐나다에서 사망자 4명을 포함한 피해자 7명이 망상 등 정신 건강 관련 문제를 겪었다며 소송을 냈다.

다른 AI 챗봇 '캐릭터.AI'를 운영하는 캐릭터테크놀로지스도 지난 10월 플로리다주 14세 소년의 유족으로부터 아들의 극단 선택의 원인으로 지목돼 피소됐다.

미국 38개 주 등 42개 지역 법무장관은 전날 오픈AI와 캐릭터테크놀로지스를 포함한 AI 기업 13곳을 상대로 안전성을 강화하고 외부 감사를 받을 것을 요구하는 공개서한을 발송하기도 했다.


김대호 글로벌이코노믹 연구소장 tiger8280@g-enews.com
맨위로 스크롤