포털에서의 뉴스 검색을 두고 온라인 포털과 언론사 간 논쟁이 일더니 이번에는 챗GPT 등 생성형AI와 언론사 간 논란이 일고 있다. 뉴욕타임스, 로이터, CNN, 호주 ABC방송 등 주요 매체들이 챗GPT 개발사인 오픈AI의 콘텐츠 접근 기능 차단에 나섰다.
전쟁의 시작은 뉴욕타임스로부터 촉발됐다. 뉴욕타임스가 AI 회사를 저작권 위반으로 고소할 계획임을 알렸다. 여기에 다른 언론사들도 AI의 무분별한 뉴스 정보 수집에 민감하게 반응, 챗GPT의 접근을 속속 차단하는 언론사가 증가하기 시작했다.
오픈AI의 챗GPT는 대화형 AI 서비스다. 오픈AI의 기본 기술은 GPT(Generative Pre-trained Transformers)로 알려진 기계 학습 모델 그룹을 기반으로 구축됐으며 GTP 모델은 인간과 유사한 텍스트를 생성하고 질문에 답하거나 이미지를 생성하고 언어 간 번역 기능도 제공한다. 이를 보다 고도화한 챗GPT는 사용자가 챗GPT에 날씨, 길찾기, 맛집, 주요 정보 등을 문의하면 학습한 데이터를 바탕으로 상당히 정교하게 답한다. 실제 개발자들도 챗GPT와 같은 AI를 사용해 개발을 할 정도로 효용성이 입증됐다. 삽시간에 전 세계에 챗GPT 열풍이 불었고 이제 오픈AI는 회사 규모가 300억달러(약 39조6200억원)로 급성장했다.
문제는 챗GPT가 답변하기 위해 수집하는 데이터 상당수가 뉴스를 기반으로 한다는 데 있다. 챗GPT 외에 구글의 바드(Bard), 메타의 라마2(Llama-2) 같은 AI 모두 스스로 정보를 생성하는 대신, 기 공개된 정보들을 습득하고 학습한다. GPT봇으로 알려진 웹 크롤러(Web Crawler)가 방대한 웹 페이지를 방문해 각종 정보를 자동으로 수집한다. 여기에는 각종 SNS에 올라온 게시물과 블로그 글도 포함되지만 뉴스기사와 전자책 등의 데이터도 포함된다. 특히 주요 현안에 대한 과거 기록과 최신 정보 상당수가 뉴스에서 수집되는 만큼 생성형AI는 어찌 보면 뉴스를 무단으로 도용하는 셈이 된다.
구글과 네이버의 경우에는 사용자가 어떤 검색어를 입력하면 해당 정보를 제공하는 주소로 유도한다. 때문에 언론사가 포털로 인해 직접적으로 피해를 입지 않았다. 그러나 챗GPT 등 AI는 뉴스 사이트를 열어주는 대신 뉴스 정보만을 가져와서 챗GPT 대화창에서 해당 정보를 제공한다. 뉴스 콘텐츠 창작자들이 만든 콘텐츠를 가로채 뉴스 제공자에게 가지 못하게 하는 셈이다. 이 과정에서 언론사는 트래픽 향상에 따른 광고 수익조차 얻지 못한다.
이와 관련해 올해 초 미국의 미디어 복합기업 뉴스 코펴레이션의 다우존스 사업부 법무 자문위원 제이슨 콘티는 성명을 통해 "월스트리트저널 기자들의 작업을 이용해 인공지능을 훈련시키려는 사람은 다우존스로부터 이에 대한 권리를 적절하게 라이센스 받아야 한다"고 지적했다.
국내에서 한국신문협회도 유사한 목소리를 냈다. 한국신문협회는 "뉴스는 AI 기술 발전을 위한 학습용 데이터로 활용할 수 있는 퀄리티 콘텐츠다. 이에 따라 회원사는 뉴스 콘텐츠에 대한 저작권 보호와 정당한 보상이 이뤄질 수 있도록 정부가 적극 나설 것을 요구했다. 또 검증되지 않은 기사를 AI를 통해 제작·유포할 경우 제재 방안도 마련할 것을 주문했다"고 밝혔다.
국내에서는 자연히 네이버의 입장에 관심이 쏠렸다. 네이버가 이달 24일 공개한 '클로바X'가 한국형 챗GPT로 대화형AI 서비스를 제공하기 시작했기 때문이다. 클로바X 역시 AI 답변에 뉴스 데이터를 활용하고 있다.
이와 관련해 최수연 네이버 대표는 "콘텐츠를 제공하는 기업과 기술기업이 상호 '윈윈'하는 방향으로 논의가 계속 이뤄져야 한다"면서 "이를 위해 다양하게 논의를 진행하고 있다"고 말했다.
이상훈 글로벌이코노믹 기자 sanghoon@g-enews.com