중국은 거대언어모델(LLM) 학습용 데이터보다 수급이 어려운 피지컬 AI 용 데이터 생산·확보에 사활을 걸고 있는 것으로 나타났다. 반면 한국은 피지컬 AI 기술 고도화에 필수적인 데이터 확보에 '걸음마' 수준이라는 평가가 나온다.

9일 한국지능정보사회진흥원(NIA)의 '중국이 주도하는 AI·휴머노이드 로봇 산업 현황' 보고서에 따르면 중국의 로봇 전문가들은 데이터 기반의 학습·훈련과 AI 모델 고도화에 집중해 휴머노이드 로봇 기술의 글로벌 우위를 유지하고 있다.
텐센트 투자로 명성을 얻은 휴머노이드 로봇 스타트업 애지봇은 상하이에 대규모 데이터 수집 공장을 구축하고 고품질 실세계 데이터를 생성 중이다. 애지봇은 2023년 상하이에 세운 데이터 수집 공장에 로봇 약 100대를 투입해 인력 200명과 함께 하루 3만∼5만 건의 데이터를 축적하고 있다.
애지봇은 실세계 데이터를 포함한 오픈소스 데이터셋 '애지봇 월드'를 지난해 공개하기도 했다. 엔비디아가 휴머노이드 로봇 개발용 파운데이션 AI 모델 '아이작 그루트 N1' 학습에 쓴 실세계 데이터 80%를 애지봇 월드에서 얻었다는 조사 결과도 있다.
중국은 피지컬 AI 관련 인재 보유에서도 앞서나가고 있다. 지난해 중국 대학의 로봇 관련 전공 재학생 수는 58만명을 넘어섰다. 이는 전 세계 로봇 관련 전공자의 42%를 차지하는 수준이다.
보고서는 "중국에서 휴머노이드 로봇 활용이 늘어나고 제조 부문 공장으로 확산되면 실제와 합성 데이터를 포괄한 피지컬 AI 학습용 데이터 수집에 가속이 붙을 것"이라며 "중국 정부는 수많은 공장의 작업을 휴머노이드 로봇이 수행하는 '신산업혁명'을 꿈꾼다"고 분석했다.
반면 국내 피지컬 AI 고도화를 위한 데이터 확보는 아직 초보 수준이다. 한국지능정보사회진흥원의 '피지컬 AI 글로벌 동향 및 대응 전략' 보고서는 정부가 운영하는 AI 학습용 데이터 개방 사이트 'AI 허브'가 국내 로보틱스·자율주행 연구 및 서비스 개발에 활용될 수 있는 기초 인프라를 제공하는 중이다. 하지만 환경의 다양성·국제 호환성에서 제한적이고 실시간 데이터도 부족한 상황이라고 지적했다.
보고서는 "자율주행·로봇·헬스케어 산업 현장에서 필요한 로봇 행동 데이터, 센서·환경 데이터 등 심층 데이터셋의 단계적 구축과 개방이 필요하다"며 "구축된 데이터는 항만·공항·병원·스마트 건물 등 거점 디지털 트윈 기반 시뮬레이션 환경과 연계돼야 한다"고 설명했다.
공병선 기자 mydillon@asiae.co.kr
▶ 2026년 사주·운세·토정비결·궁합 확인!
▶ 십자말풀이 풀고, 시사경제 마스터 도전! ▶ 속보·시세 한눈에, 실시간 투자 인사이트