글로벌 인공지능(AI) 산업이 이른바 '피크 데이터(peak data)' 문제에 직면했다는 우려가 커지고 있는 가운데 구글 딥마인드가 새로운 AI 학습 접근법을 통해 해결책을 제시하고 나서 이목을 끌고 있다.
이 접근법은 '추론 시간 연산'과 '합성 데이터'를 활용한 AI의 ‘자기 개선’ 기술로 AI 모델이 더 나은 데이터를 스스로 생성해 훈련에 활용할 수 있는 가능성을 보여준다는 점에서 주목받고 있다.
5일(이하 현지시각) 비즈니스인사이더에 따르면 세계 1위 생성형 AI 전문업체인 오픈AI의 일리야 수츠케버 공동 창업자 겸 수석과학자는 지난달 미국에서 열린 관련업계 행사에서 “더 이상 새로운 유용한 데이터는 없다”며 AI 모델 훈련에 필요한 데이터의 부족 문제를 강조했다. AI 기술의 발전이 데이터 의존성을 극복하지 못할 경우 성장이 멈출 수 있다는 우려를 밝힌 셈이다.
비즈니스인사이더는 “현재까지 인터넷에 존재하는 모든 유용한 데이터는 이미 대규모 AI 모델 훈련에 사용됐으며 더 이상 질적으로 새로운 데이터를 확보하기 어려운 상황”이라면서 “이는 AI 모델이 지속적으로 발전하기 위해서는 기존 데이터 외에 새로운 데이터 생성 방식이 필요함을 시사한다”고 지적했다.
비즈니스인사이더에 따르면 구글 딥마인드 연구진이 개발한 '추론 시간 연산'이라는 새로운 접근법은 AI 모델이 복잡한 문제를 단계별로 나눠 해결하도록 유도한다는 것이 특징이다.
이 방법은 AI가 하나의 질문을 여러 개의 하위 작업으로 나누고, 각 단계에서 정확한 결과를 도출해야만 다음 단계로 넘어갈 수 있도록 설계된 것으로 알려졌다.
비즈니스인사이더에 따르면 딥마인드 연구진은 이 기법을 통해 AI가 문제를 좀 더 깊이 분석하고 더 높은 수준의 결과물을 생성할 수 있음을 실험으로 입증했다.
이 접근법을 사용한 AI 모델은 기존 모델에 비해 나은 품질의 데이터를 생성할 수 있었으며 이는 향후 AI 훈련 데이터로 재활용될 가능성을 열었다는 것이 딥마인드 연구진의 설명이라는 것.
연구진은 "추론 시간 연산을 통해 생성된 고품질 출력 결과가 다시 AI 모델 훈련에 활용된다면 AI는 더 적은 데이터로도 더 나은 성능을 발휘할 수 있다"고 주장했다.
이와 관련해 사티아 나델라 마이크로소프트 최고경영자(CEO)는 최근 출연한 한 팟캐스트 방송에서 "추론 시간 연산은 AI 모델의 성능을 새로운 수준으로 끌어올리는 스케일링 법칙 중 하나"라며 긍정적인 견해를 밝혔다.
스케일링 법칙이란 AI 모델의 성능이 데이터, 모델 크기, 계산량(연산량)의 증가에 따라 어떻게 향상되는지를 설명하는 경험적 법칙을 말한다.
나델라 CEO는 "이 방식을 통해 AI가 생성한 데이터를 다시 훈련 데이터로 사용할 수 있다면 더욱 강력한 AI 모델이 탄생할 것"이라며 이같이 말했다.
AI 모델의 성능을 더 높은 수준으로 끌어올리기 위해서는 추론 시간 연산을 최적화하거나 더 많은 연산 능력을 투입해야 한다고 강조한 셈이다.
또 미국 캘리포니아주립대 버클리캠퍼스(UC버클리) 소속 AI 전문가로 이번 연구에 참여한 찰리 스넬은 “AI 모델이 추론 시간 연산을 통해 개선된 출력을 생성하고 이를 데이터로 재활용할 수 있다면 데이터 병목 현상을 해결할 수 있는 중요한 열쇠가 될 것"이라고 밝혔다.
AI 전문가들에 따르면 이 새로운 접근법은 수학 문제처럼 명확한 답이 있는 분야에서 특히 강력한 성능을 발휘하는 이점을 안고 있다. 다만 정답이 명확하지 않은 작업에서도 이 기법이 얼마나 효과적일지 아직 검증이 필요하다는 지적도 있다.
김현철 글로벌이코노믹 기자 rock@g-enews.com