오픈AI가 기대를 모았던 챗GPT의 음성 지원 기능 출시를 연기한다.
25일(현지 시각) 블룸버그는 오픈AI가 챗GPT의 유료 버전 사용자들에게 제공하려 했던 음성 지원 기능의 출시를 연기하기로 했다고 보도했다.
오픈AI는 지난 5월 텍스트, 오디오, 이미지를 실시간으로 처리할 수 있는 ‘GPT-4’ 모델의 업데이트 버전인 ‘GPT-4o’를 발표하면서 음성 지원 기능을 공개한 바 있다. 이를 이용하면 사용자가 직접 명령어(프롬프트)를 입력하지 않아도 이용자의 음성을 인식해 AI 생성 기능을 구동하고 음성으로 대답하는 ‘대화형 AI’로 업그레이드될 수 있어 많은 기대를 모았다.
오픈AI가 음성 지원 기능의 출시를 연기한 것은 해당 기능의 안정성이나 응답성 등이 출시 목표 기준에 도달하지 못했기 때문으로 풀이된다. 회사 측은 이날 성명을 통해 “원래 6월 말에 소수의 유료 ‘챗GPT 플러스’ 가입자에게 음성 기능을 출시할 계획이었지만 출시 기준에 도달하려면 한 달이 더 필요하다”고 밝혔다.
이어 오픈AI는 “우리는 특정 콘텐츠를 감지하고 거부하는 모델의 기능을 개선하고 있다”라며 “우리는 사용자 경험을 개선함과 더불어, 수백만 건에 달하는 응답을 실시간으로 유지할 수 있도록 확장된 인프라를 준비하기 위해 노력하고 있다”라고 덧붙였다.
블룸버그는 오픈AI의 이번 신규서비스 출시 지연이 갈수록 혼잡해지는 AI 시장에서 오픈AI의 발목을 잡을 우려가 있다고 지적했다.
지난해 오픈AI는 챗GPT에 사용자와 제한적으로 대화할 수 있는 기능을 선보이면서 추후 챗GPT에 더욱 빠르고 강력한 이미지 인식 기능을 결합해 훨씬 더 유용하고 역동적인 대화 파트너로 만들겠다고 약속한 바 있다.
지난 5월 GPT-4o 신제품 출시 행사 무대에서는 챗GPT가 연구원과 음성으로 각종 질문을 주고받고, 스마트폰 카메라로 촬영한 수학 문제를 인식하고 풀면서 음성으로 대답하는 모습을 시연하기도 했다.
다만, 해당 시연에 사용된 AI의 목소리가 AI 가상 비서를 소재로 한 영화에서 목소리를 맡은 유명 여배우와 비슷한 점이 논란을 일으키면서 한때 음성 지원 기능의 출시 여부 자체에 대한 우려가 불거지기도 했다.
한편, 오픈AI는 이날 성명을 통해 올해 가을까지 모든 유료 가입자에게 음성 기능을 출시할 것이며, 5월 행사에서 시연했던 비디오 및 화면 공유 기능도 출시하기 위한 작업을 진행 중이라고 밝혔다. 또 회사 측은 향후 이러한 신기능의 출시 시기에 대해 사용자들에게 더 자세히 알릴 방침이라고 덧붙였다.
블룸버그는 챗GPT에 음성 기능이 추가되더라도 출시 행사에서 시연된 모습에 비해 다소 제한적인 형태로 작동할 가능성이 높다고 예측했다.
최용석 글로벌이코노믹 기자 rpch@g-enews.com