구글에 한방 먹인 '챗GPT', 다음 공격 타깃은 자기 자신?

가짜 뉴스·스팸 사이트 속출…자신이 학습할 웹 데이터 오염시켜

이원용 기자

기사입력 : 2023-03-15 17:24

"헤이즐(Hayssel)은 한국을 대표하는 영상 크리에이터입니다. 본명은 김해솔, 1996년생으로 미국 캘리포니아에서 태어났습니다. 그는 2021년 기준 유튜브에서 22만명의 구독자를 모았으며 팬들에게 '해바라기'란 별명으로 불립니다."

국내 모 챗GPT 기반 챗봇 서비스에게 한국의 유명 유튜버를 소개해달라고 하자 나온 대답이었다. 그러나 실제로 유튜브에는 1996년생 김해솔도, Hayssel이란 계정도 없었다. 완전한 '가짜 정보'다.

챗GPT가 오류를 범한 사례는 수도 없이 많다. 대통령의 이름과 같은 고유 명사나 숫자 단위 등에 오류가 생기는 것은 이미 공공연하게 알려져 있다. "신사임당은 이순신과 결혼했다"는 등 가짜 역사를 말하는 경우도 부지기수다. 이는 챗GPT의 문제라기 보단 '정교해 보이는 텍스트'를 만들어내는 자연어 생성 AI의 본질적 한계에 가깝다.

문제는 이러한 가짜 정보들이 데이터로 인터넷 상에 퍼진다는 것이다. 챗GPT의 작문 능력은 이미 '피싱(사람을 속이는 형태의 범죄 수법)'을 위한 미끼 문구를 만드는 데 악용되고 있다. 챗GPT를 악용한 가짜 뉴스 소셜 미디어 계정, 스팸 사이트도 우후죽순처럼 생겨나고 있다.

앞서 챗봇과의 대화에서 헤이즐의 실존 여부를 캐묻자, 챗봇은 '헤이즐'의 유튜브 계정이라며 링크를 제공했다. 해당 링크를 타고 들어가자 '존재하지 않는 채널'이란 안내가 떴다. 챗봇의 소유주가 사이버 범죄자였다면 악성 코드를 설치하는 링크를 대신 제공했을 수도 있다.

유튜브에 '챗GPT로 돈 버는 법'을 검색하면, 가짜 뉴스 블로그 등을 만드는 법을 자세히 소개한 영상들이 여럿 게재돼있다. 사진=유튜브 캡처

한 IT업계 관계자는 "챗GPT가 구글을 망치고 있다는 말은 중의적"이라는 평을 남겼다. 이는 챗GPT가 이른바 '스마트 검색 엔진'으로 주목받으며 구글이 '적색 경보'를 낸 일과 더불어 챗GPT 등 자연어 생성 AI가 만든 이른바 '쓰레기 데이터'들이 구글 등 인터넷 생태계를 오염시켜 정보 검색의 능률을 떨어트리고 있다는 것이다.

실제로 유튜브에 '챗GPT로 돈 버는 법'을 검색하면 챗GPT로 작성한 이른바 '가짜 뉴스'나 스팸 메시지를 블로그나 소셜 미디어 등에 게재해 광고 수익을 올리는 유형의 부업을 추천하는 영상들이 수도 없이 게재돼 있다. 이들은 앞서 언급한 스팸 사이트 등의 증가로 이어지고 있다.

BBC는 "챗GPT 등 자연어 생성 AI는 가짜 뉴스 생성을 위한 유용한 도구"라고 지적했다. 이들은 지난 2016년 미국 대통령 선거에서 '조직적인 가짜 뉴스 유포'가 벌어졌다며 "AI는 양적, 질적인 면 모두 더 나은 '가짜 뉴스 살포기'가 돼 가짜 정보로 인터넷을 가득 채울 것"이라고 경고했다.

AI에 의한 가짜 정보의 범람은 역으로 AI 자신의 몰락까지 불러올 수 있다. 챗GPT와 같은 생성형 AI는 데이터를 학습하는 '머신 러닝'형 AI다. 학습의 대상이 되는 데이터는 구글 등 인터넷을 통해 얻는다. 이는 자신이 만든 가짜 정보를 다시 학습하는 결과를 낳게 된다.

이안 보고스트 세인트루이스 워싱턴 대학교 예술·과학 미디어학부 교수는 디 애틀랜틱에 기고한 칼럼을 통해 "인터넷은 본래 수많은 거짓 정보의 홍수였는데 챗GPT와 같은 AI들은 이러한 점을 증폭시키고 있다"며 "챗GPT는 컴퓨터로 일을 하는게 아닌 혼란을 가중시키는 존재이며 나아가 스스로를 파괴할 수도 있다"고 평했다.

챗GPT 개발사 오픈AI는 이러한 부작용을 막기 위해 'AI 텍스트 분류기'를 지난 1월 말 내놓았다. 실제 활용 결과, 모든 AI 생성 텍스트 중 26%만을 'AI가 작성했을 가능성이 있음'으로 평가했다. 인간이 작성한 텍스트를 AI가 작성한 텍스트로 오탐지한 비율도 9%였다.

오픈AI 측은 "텍스트 분류기를 완성하는 것은 대형 AI 언어 모델을 시장에 보다 안전하게 배포하기 위해 매우 중요한 임무"라며 "당사는 챗GPT의 한계와 부작용에 대해 계속 논의할 것이며 개선된 결과물에 대해 지속 공유할 것"이라고 밝혔다.

경제협력개발기구(OECD) AI 정책 관측소에 따르면 현재 세계 69개국에서 AI 정책에 관한 논의가 이뤄지고 있다. 국내에서도 국회 과학기술정보방송통신위원회가 지난 2월 14일, AI 산업 육성 관련 법안 총 7개를 병합 심사, 의결한 것으로 알려졌다.

미국 경영컨설팅사 리더로직의 닉 웹 대표는 "지금의 AI는 매우 똑똑해보이지만 실제로는 윤리와 인간성이 없고 위험한 도구라는 면에서 권총과 다를 바 없다"며 "이를 토대로 AI를 있는 그대로의 무기로서 접근, 올바르게 활용할 방안을 정립해야 한다"고 말했다.

프란체스카 로시 IBM AI 윤리 글로벌 리더는 "몇해 전까지만 해도 AI가 이렇게 대중화되리라곤 상상할 수 없었다"며 "AI 기술 자체를 규제하기보단 AI 앱의 위험성을 정량적으로 분석, 단계적으로 의무를 지게 하는 형태로 규제를 완성해야 할 것"이라고 전했다.

이원용 글로벌이코노믹 기자 wony92kr@naver.com