어디까지 ‘독자 AI’로 인정할까… 기술 자립성 논란 확산

민나리 기자
수정 2026-01-07 01:08
입력 2026-01-07 01:08
‘프롬 스크래치’ 기준 모호해 혼선
“인코드 활용… 핵심 엔진 자체 개발”
업스테이지, 공개 검증 통해 일단락
“솔라 오픈, 中 딥시크 R1 성능 앞서”해외 기술에 의존하지 않는 ‘소버린 인공지능(AI)’ 확보를 위해 정부가 추진 중인 독자 AI 파운데이션 모델 프로젝트가 기술 자립성 논쟁에 휩싸였다. 핵심 쟁점은 모델을 바닥부터 직접 개발했는지를 뜻하는 ‘프롬 스크래치(From Scratch)’ 방식의 충실성 여부다.
6일 업계에 따르면 네이버와 업스테이지 등 국내 대표 AI 기업들의 기술 출처를 두고 의혹이 잇따르면서, 국가 프로젝트의 명확한 기준이 필요하다는 목소리가 높다. 프롬 스크래치란 기존 AI 모델을 수정해 쓰는 것이 아니라, 모델 설계부터 학습까지 전 과정을 처음부터 수행하는 방식을 뜻한다. 기존 모델의 지능이나 가중치 값을 물려받지 않고 ‘빈 도화지’ 상태에서 기술을 구축하기 때문에, 특정 국가나 기업의 정책 변화에 휘둘리지 않고 AI를 통제할 수 있는 핵심 역량이다.
최근 논란의 중심에 선 건 네이버클라우드다. 이 회사의 멀티모달 AI 모델인 ‘하이퍼클로바X 시드 32B 싱크’가 중국 알리바바의 ‘큐웬(Qwen) 2.5’ 기술을 차용했다는 분석이 나왔는데, 해당 모델이 시각 정보를 처리하는 비전 인코더와 가중치 값에서 큐웬과 매우 높은 유사도를 보인다 내용이었다. 네이버 측은 글로벌 호환성과 효율성을 위한 전략적 선택이었을 뿐 핵심 엔진은 자체 개발했다고 해명했지만, 일각에선 외산 모듈을 쓴 모델을 소버린 AI로 부를 수 있느냐는 지적을 내놓았다.
앞서 업스테이지가 개발한 ‘솔라 오픈 100B(Solar-Open-100B)’ 모델 역시 중국 지푸AI의 ‘GLM-4.5-에어’를 도용한 것이 아니냐는 의혹을 받았다. 업스테이지는 ‘솔라 오픈 100B’ 모델의 중국 모델 도용 의혹에 대해 학습 로그를 전격 공개하며 프롬 스크래치 방식임을 입증해 논란은 일단락됐다. 이날 오픈소스에 공개된 ‘솔라 오픈’은 크기는 작은 데 비해 한국어 능력 등 주요 지표에서 중국의 최신 모델인 ‘딥시크(DeepSeek) R1’을 앞지르는 결과를 내기도 했다.
업계는 정부가 제시한 프롬 스크래치 기준이 모호하기 때문에 논란이 지속될 것으로 봤다. 현재 지침은 ‘전 과정 수행’이라는 원칙만 있을 뿐, 어느 범위까지 자체 학습 결과물이어야 독자 모델로 인정할지에 대한 세밀한 지침이 빠져 있다는 지적이다. 업계 관계자는 “논란이 확산하는 상황에서 정부의 침묵은 혼란만 키울 뿐”이라며 “단순히 성능 수치에 매몰될 것이 아니라, 개발 과정을 투명하게 검증할 수 있는 객관적인 평가 기준을 민관이 함께 마련해 신뢰를 확보하는 것이 시급하다”고 말했다.
민나리 기자
2026-01-07 22면
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
Q.
기사를 다 읽으셨나요? AI 퀴즈로 핵심 점검!
프롬 스크래치 방식의 핵심 의미는?
