적은 메모리로도 휴머노이드 시력 높이는 기술 나왔다

유용하 기자
수정 2026-06-17 09:23
입력 2026-06-17 09:23
세줄 요약
- GPU 메모리 절감형 시각 복원 기술 개발
- 이미지 한 장으로 고해상도 정보 복원
- 휴머노이드·자율주행 적용 가능성 제시
카이스트 제공
인간의 오감은 다양한 외부 정보를 받아들이는 중요한 창구다. 오감 중 어느 한 쪽에 기능이 약화되면 정보 수용이 제한될 수 있다. 특히 눈을 통해 받아들이는 정보는 엄청나다. 이는 사람뿐만 아니라 기계에서도 마찬가지다. 인공지능의 눈 역할을 하는 컴퓨터 비전 기술은 스마트폰 안면 인식부터 휴머노이드 로봇까지 다양하게 활용된다. 이들 장치에서는 시각 정보를 고해상도로 인식하는 것이 중요하다.
이에 카이스트 전기및전자공학부, 미국 매사추세츠공과대(MIT), 마이크로소프트 공동 연구팀은 적은 GPU(그래픽처리장치) 메모리만으로도 인공지능(AI)이 세상을 더 선명하게 볼 수 있도록 하는 범용 기술을 개발해 메모리 효율을 최대 16배 높였다고 17일 밝혔다. 이 기술은 인공지능 및 컴퓨터 비전 분야 국제 학술대회인 ‘CVPR 2026’에서 지난 7일 발표됐고 계산 자원의 효율적 활용을 인정받아 ‘CVPR 컴퓨트 골드 스타’ 상을 받았다. 연구 과정의 투명성과 재현 가능성 부분에서도 인정받아 ‘트랜스패런시 챔피언’에도 선정됐다.
최근 휴머노이드 로봇, 자율주행 시스템, 현실의 물리적 환경과 변화를 학습해 예측하는 AI 모델인 세계 모델은 연산 속도를 높이고 메모리 사용량을 줄이기 위해 입력 영상을 저해상도로 압축해 활용하고 있다. 문제는 압축하는 과정에서 작은 물체나 얇은 구조물, 미세한 결함 같은 중요한 시각 정보가 손실될 수 있다는 점이다. 또 모든 영상을 고해상도로 처리하면 막대한 GPU 메모리와 연산 자원이 필요한 실시간 처리가 어려워진다. 이는 스마트폰 같은 소형 기기나 기동성이 중요한 휴머노이드 로봇이 주변 환경을 정밀하게 인식해야 하는 상황에 빠르게 대처할 수 없게 만든다.
이에 연구팀은 입력 이미지의 경계와 구조 정보를 활용해 저해상도 특징 정보를 고해상도로 복원하는 ‘업샘플 애니씽’(Upsample Anything)을 개발했다. 기존 기술은 새로운 환경이나 데이터에 적용하기 위해 별도의 재학습이나 복잡한 최적화 과정을 거쳐야 했지만 이번 기술은 추가 데이터 학습 없이 입력 이미지 한 장만으로 최적의 복원 방식을 찾아낼 수 있어 다양한 환경에 즉시 적용할 수 있다.
또 모든 시각 정보를 고해상도로 저장·처리하지 않고 핵심 정보만 압축해 활용함으로써 GPU 메모리 사용량을 크게 줄였다. AI 연구에서 주로 사용되는 약 5만 픽셀, 224×224 크기 이미지를 기준으로 0.4초의 짧은 계산만으로 원본에 가까운 시각 정보를 복원했고 GPU 메모리 효율도 최대 16배까지 향상시키는 것으로 확인됐다.
카이스트 제공
연구를 이끈 김창익 카이스트 교수는 “제한된 연산 자원만으로도 AI가 주변 환경을 더욱 정밀하게 인식할 수 있게 한 이번 기술은 스마트폰 같은 소형 기기는 물론 작은 물체를 정확하게 식별하고 조작해야 하는 휴머노이드 로봇, 자율주행 시스템, 온디바이스 AI 등 다양한 차세대 인공지능 분야에 폭넓게 활용될 수 있을 것”이라고 밝혔다.
유용하 과학전문기자
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
[ 내안의 AI 본성 분석 :
UNMASK ]
기사 읽는 습관에 숨겨진 당신의 MBTI는?
Q.
기사를 다 읽으셨나요? AI 퀴즈로 핵심 점검!
연구팀이 개발한 ‘업샘플 애니씽’ 기술의 GPU 메모리 효율 향상 정도는?

![THE NEXT : AI 운명 알고리즘 지금, 당신의 운명을 확인하세요 [운세 확인하기]](https://imgmo.seoul.co.kr/img/n24/banner/ban_ai_fortune_v2.png)
