메뉴 글로벌이코노믹 로고 검색
검색버튼

머스크 “AI 학습 데이터 고갈 문제 사실”…‘합성 데이터’ 제안

일론 머스크 xAI 창업자. 사진=로이터이미지 확대보기
일론 머스크 xAI 창업자. 사진=로이터
인공지능(AI)의 학습에 절대적으로 필요한 데이터의 고갈 문제를 일론 머스크 테슬라 최고경영자(CEO)가 인정하며 ‘합성 데이터’라는 새로운 개념을 제안했다.

10일(이하 현지시각) 테크크런치에 따르면 머스크 CEO는 지난 8일 소셜미디어 X에서 세계적인 베스트셀러 ‘마이크로트렌드’의 저자인 마크 펜과 진행한 온라인 좌담회에서 “인간 지식의 축적된 총량을 AI 훈련에 사실상 소진했다”며 이같이 밝혔다.

세계 1위 생성형 AI 개발업체 오픈AI의 대항마로 xAI를 창업한 그는 “이같은 데이터 고갈 문제는 사실상 지난해 발생했다”면서 “AI 개발 방식에 전환이 불가피하다”고 말했다.
테크크런치는 “머스크의 이같은 발언은 지난달 캐나다 몬트리올에서 열린 머신러닝 컨퍼런스에서 일리야 수츠케버 오픈AI 공동 창업자가 제기한 ‘피크 데이터(peak data)’ 문제와도 맥을 같이 한다”고 전했다.

당시 수츠케버는 AI 훈련에 필요한 데이터D의 부족으로 AI 모델 개발 방식이 근본적으로 변화할 것이라고 전망했었다.

머스크는 “AI가 스스로 훈련 데이터를 생성하고 이를 통해 자기 학습을 진행하는 것이 유일한 대안”이라고 덧붙여 데이터 부족 문제를 해결하기 위한 방안으로 ‘합성 데이터(synthetic data)’를 제시했다.
합성 데이터는 AI 모델이 자체적으로 데이터를 생성해 이를 학습에 사용하는 방식이다.

이와 관련해 구글 딥마인드는 '추론 시간 연산'을 통해 AI 모델이 스스로 고품질 데이터를 생성하는 방안을 앞서 제시했다.


김현철 글로벌이코노믹 기자 rock@g-enews.com
맨위로 스크롤