글로벌 IT기업들이 앞다퉈 인공지능(AI) 개발에 나서면서 AI학습에 필요한 데이터 소유권의 중요성이 AI산업에서 부각되고 있다.
19일(현지 시간) CNBC에 따르면, 일론 머스크 테슬라 최고경영자(CEO)이자 트위터 최고경영자는 자신의 트위터를 통해 마이크로소프트(Microsoft)가 AI학습에 트위터의 데이터를 불법적으로 사용했다고 주장하며 마이크로소프트에 대한 법적 조치를 취할 것임을 시사했다.
일론 머스크의 이 같은 발언은 다수의 매체들이 마이크로소프트가 광고 플랫폼에서 트위터를 삭제하겠다고 보도한 이후에 나온 것으로 마이크로소프트의 트위터 광고 배제에 일론 머스크가 마이크로소프트를 압박한 것 아니냐는 분석이 나오고 있다.
아직 소송은 제기되지 않은 것으로 보이며 트위터와 마이크로소프트 측도 이에 대한 공식적인 답변을 내놓지 않고 있다.
이번 일론 머스크의 마이크로소프트에 대한 조치는 거대 IT기업들이 앞다퉈 AI개발에 뛰어드는 가운데, 데이터 소유권의 중요성이 점차 강화되고 있다는 사실을 보여준다. AI학습에는 필수적으로 데이터가 필요하고 이를 파악한 데이터 보유 기업들은 데이터 사용료를 AI개발 기업에 청구하려는 움직임을 보이고 있다.
알려진 바에 따르면, GPT와 같은 대규모 언어모델(LLM)은 테라바이트(TB) 단위의 데이터가 필요하며 이 중 대부분은 레딧을 비롯해 트위터와 같은 소셜네트워크서비스(SNS)에서 학습한 것으로 알려졌다.
데이터 소유권의 수요와 중요성이 부각됨에 따라 데이터를 보유한 기업들이 AI개발사에 구체적인 소유권을 주장하는 움직임이 이어지고 있다. 레딧은 이번 주 레딧 사용자 간의 대화를 AI학습에 사용한 기업에 비용을 청구할 것이라고 밝혔으며, 유니버설 뮤직그룹도 자사의 데이터를 AI학습에 이용한 것은 계약 위반이자 저작권 위반에 해당한다고 언급했다.
그뿐만 아니라 이미지 회사로 유명한 게티이미지도 이미지 생성 AI 스테이블 디퓨전이 자사의 콘텐츠를 이용해 AI를 훈련시켰다고 주장하며 소송을 제기했다.
이러한 가운데, 일론 머스크는 오는 12월 OpenAI의 트위터 데이터베이스 접근을 일시 중지시킬 것이라고 밝혔다.
장용석 글로벌이코노믹 기자 jangys@g-enews.com