휴머노이드 로봇 훈련시키는 ‘뜻밖의 주인공들’

나이지리아와 인도의 긱워커들이 집안일을 촬영한 ‘실세계 데이터’가 휴머노이드 로봇 훈련의 핵심 자원으로 떠오르고 있다. 하지만 데이터 활용의 불투명성과 개인정보 보호 문제 등 새로운 노동·윤리 논쟁도 함께 커지고 있다.

나이지리아 중부 언덕 위에 위치한 도시에 살고 있는 의대생 제우스(Zeus)는 병원에서 긴 하루를 보내고 원룸 아파트로 돌아오면 조명을 켜고 아이폰을 이마에 고정한 뒤 스스로를 촬영하기 시작한다. 그는 몽유병 환자처럼 두 손을 앞으로 들고 침대에 시트를 깐다. 손이 카메라 프레임 안에 계속 들어올 수 있도록 천천히, 신중하게 움직인다.

제우스는 캘리포니아주 팔로알토에 본사를 둔 미국 기업 마이크로1(Micro1)의 데이터 기록 작업자다. 마이크로1은 로봇 기업에 판매할 ‘실세계 데이터(real-world data)’를 수집한다. 테슬라, 피규어AI(Figure AI), 어질리티 로보틱스(Agility Robotics) 등 여러 기업이 인간과 같은 모습으로 공장과 가정에서 움직이는 휴머노이드 로봇 개발 경쟁을 벌이면서, 제우스 같은 긱 노동자(gig worker)들이 촬영한 영상이 로봇을 훈련시키는 새로운 방법으로 주목받고 있다. 긱 노동자란 필요에 따라 임시로 계약을 맺고 단기로 근무하는 노동자를 말한다.

마이크로1은 인도, 나이지리아, 아르헨티나 등 기술에 익숙한 젊은층이 일자리를 찾고 있는 50여 개 국가에서 수천 명의 계약직 노동자를 고용했다. 이들은 아이폰을 머리에 장착하고 빨래를 개거나 설거지를 하고 요리하는 모습을 촬영한다. 이 일은 현지 기준으로 보수가 좋은 편이며 지역 경제 활성화에도 기여하고 있지만, 해당 노동자들이 자신의 영상과 데이터가 어떻게 사용되는지 충분히 이해한 상태에서 정보 제공을 동의하고 있는지, 그리고 그들의 개인정보 보호 문제는 괜찮은지와 관련해 문제의 소지가 있기도 하다. 또한 이 일은 때로는 까다롭고, 어떤 면에서는 기묘하기도 하다.

지난해 11월 이 일이 링크드인과 유튜브에서 화제가 되면서 제우스도 이 작업에 대해 알게 됐다. 그는 이 일에 대해 “미래에 로봇을 훈련시키는 데 사용할 데이터를 제공하고 의미 있는 흔적을 남길 좋은 기회가 될 것”이라고 생각했다.

제우스는 시간당 15달러(약 2만 3,000원)를 받는데, 이는 높은 실업률로 어려움을 겪는 나이지리아 경제 상황에서 꽤 괜찮은 수입이다. 그러나 의사가 되기를 꿈꾸는 열정적인 학생인 그는 매일 몇 시간씩 옷을 다리는 것과 같은 반복 작업을 수행해야 하는 이 일이 지루하다고 생각한다.

제우스는 “솔직히 이 일이 그렇게 마음에 들지는 않는다”라며 “나는 머리를 조금 더 써야 하는 기술적인 일이 어울리는 사람”이라고 말했다.

제우스를 포함해 MIT 테크놀로지 리뷰와 인터뷰한 모든 노동자들은 해당 업무와 관련해 발언할 권한이 없다는 이유로 가명을 사용해 달라고 요청했다.

휴머노이드 로봇은 물리적 물체를 다루는 능력을 익히기가 매우 어렵기 때문에 개발이 특히 까다로운 것으로 악명이 높다. 그러나 챗GPT 같은 챗봇의 기반이 되는 대형언어모델(LLM)이 등장하면서 로봇공학 분야에 패러다임 전환이 일어났다. LLM이 인터넷에서 수집한 방대한 텍스트를 학습해 단어를 생성하는 법을 익혔듯이, 연구자들은 휴머노이드 로봇도 방대한 ‘움직임’ 데이터를 학습함으로써 세상과 상호작용하는 법을 배울 수 있다고 보고 있다.

( 편집자 주: 최근 실시된 설문조사에서 MIT 테크놀로지 리뷰 독자들은 휴머노이드 로봇을 ‘2026년 10대 미래 기술’ 목록에 포함될 11번째 미래 기술로 선정했다.)

설문조사 결과

로봇공학은 물리적 세계에 대한 매우 복잡한 데이터가 필요하지만, 이러한 데이터는 확보하기가 훨씬 어렵다. 가상 시뮬레이션을 활용하면 로봇에게 공중제비 같은 동작을 학습시킬 수 있지만, 물체를 잡고 옮기는 방법까지는 가르치지 못한다. 시뮬레이션으로 물리 법칙을 완전히 정확하게 모델링하는 데 한계가 있기 때문이다. 로봇이 공장에서 일하고 가정에서 가사 도우미 역할을 하려면 수집하는 데 시간과 비용이 많이 들더라도 실세계 데이터가 필요할 수 있다.

투자자들은 이 문제를 해결하기 위해 막대한 자금을 쏟아붓고 있으며, 실제로 2025년 한 해에만 휴머노이드 로봇 분야에 60억 달러(약 9조 원) 이상이 투자됐다. 그리고 가정에서 데이터를 기록하는 일은 전 세계적으로 빠르게 성장하는 ‘긱 경제’의 한 축이 되고 있다. 스케일AI(Scale AI)와 엔코드(Encord) 같은 데이터 기업들은 자체적으로 데이터 기록 인력을 대거 모집하고 있으며, 도어대시(DoorDash)는 배달 기사들에게 집안일 하는 모습을 촬영하도록 비용을 지급하고 있다. 또한 중국에서는 수십 개의 국영 로봇 훈련 센터에서 노동자들이 가상현실 헤드셋과 외골격 장치(신체 움직임을 보조, 확장하는 착용형 기계)를 착용하고 휴머노이드 로봇에게 전자레인지 문을 열거나 테이블을 닦는 방법을 가르치고 있다.

마이크로1의 알리 안사리(Ali Ansari) CEO는 “수요가 매우 많고 아주 빠르게 증가하고 있다”고 말했다. 그는 현재 로봇 기업들이 마이크로1과 같은 회사로부터 실세계 데이터를 구매하는 데 매년 1억 달러 이상을 지출하고 있다고 추산했다.

일상의 하루

마이크로1의 작업자들은 자라(Zara)라는 AI 에이전트의 검증을 거친다. 자라는 인터뷰를 진행하고 집안일 영상 샘플을 검토한다. 작업자들은 매주 집에서 집안일 하는 모습을 촬영한 영상을 제출하는데, 손을 계속 화면에 보이게 하고 자연스러운 속도로 움직이라는 등의 지침을 따라야 한다. 영상은 AI뿐 아니라 인간 검토자의 평가를 받고 승인되거나 반려된다. 영상이 승인되면 AI와 수백 명의 인력으로 이루어진 팀이 영상 속 행동에 행동 정보를 추가하는 라벨링 작업을 진행한다.

이와 같은 로봇 훈련 방식은 아직 초기 단계이기 때문에 어떤 데이터가 좋은 학습 데이터인지 아직 명확하지 않다. 그럼에도 안사리 CEO는 “로봇이 기본적인 이동과 물체 조작 방식을 다양한 상황에 적용하려면 아주 많은 사례를 제공해야 한다”고 말했다.

그러나 많은 작업자들은 좁은 집 안에서 다양한 ‘집안일 콘텐츠’를 만들어내는 것이 쉽지 않다고 입을 모았다. 소박한 원룸에 사는 제우스는 매일 옷을 다리는 것 외에는 촬영할 만한 내용을 찾기 어렵다. 인도 델리에서 과외 교사로 일하는 아르준(Arjun)은 새로 촬영할 집안일을 생각해 내는 데 시간을 많이 써야 하기 때문에 15분짜리 영상을 만드는 데 한 시간이 걸린다.

그는 “집 안에서 만들 수 있는 콘텐츠에는 한계가 있다”고 지적했다.

또 다른 민감한 문제는 개인정보 보호다. 마이크로1은 작업자들에게 얼굴을 촬영하지 말고 이름, 전화번호, 생년월일 같은 개인정보를 드러내지 말라고 요구한다. 또한 영상 제출 후 AI와 인간 검토자를 통해 영상에 개인정보가 포함되어 있는지 확인 후 제거한다.

그러나 얼굴이 나오지 않더라도 영상에는 작업자의 매우 사적인 단면이 담긴다. 집 내부 구조, 소유 물건, 일상적인 생활 방식 등이 그대로 드러나기 때문이다. 카메라 앞에서 집안일을 하는 동안 어떤 개인정보가 기록되고 있는지 스스로 파악하는 것도 쉽지 않다. 영상 검토 과정에서도 가장 명확한 식별 정보 외에는 민감한 정보를 완전히 걸러내지 못할 가능성이 있다.

가족이 있는 작업자들은 영상에 사생활이 찍히지 않도록 끊임없이 조심해야 한다. 두 딸을 둔 아르준은 촬영 중에 활발한 두 살배기 딸이 화면에 들어오지 않도록 애써야 한다. 그는 “딸이 아직 어려서 일하기가 매우 힘들 때가 있다”고 말했다.

나이지리아에서 은행원으로 일하다가 데이터 기록 작업자로 전향한 사샤(Sasha)는 공동 주택 단지에서 빨래를 널 때 이웃이 촬영되지 않도록 조심스럽게 움직인다. 그러면 이웃들은 의아한 눈길로 바라본다.

MIT 테크놀로지 리뷰와 인터뷰한 작업자들은 자신들의 데이터가 로봇 훈련에 사용된다는 사실은 알고 있지만, 해당 데이터가 구체적으로 어떻게 사용되고 저장되며 제3자(예를 들어 마이크로1이 데이터를 판매하는 로봇 기업)와 어떻게 공유되는지는 알지 못한다. 안사리 CEO는 “기밀 유지 이유로 마이크로1은 고객사를 공개하지 않으며 작업자들에게 자신들이 참여하는 프로젝트의 구체적인 성격도 알리지 않는다”고 설명했다.

메릴랜드 대학교의 야스민 코투리(Yasmine Kotturi) 인간 중심 컴퓨팅 교수는 “이러한 작업에 참여하는 노동자들에게 기업이 기술의 목적과 향후 방향, 그리고 장기적인 영향 등을 충분히 알려줘야 한다”고 지적했다.

일부 작업자들은 회사 슬랙 채널에서 다른 작업자들이 자신의 데이터를 삭제해 달라고 요청하는 모습을 본 적이 있다고 말했다. 마이크로1은 실제로 이러한 데이터가 삭제되는지에 대해서는 답변을 거부했다.

안사리 CEO는 “사람들은 자발적으로 이 일에 참여하고 있으며 언제든지 그만둘 수 있다”고 강조했다.

얼마나 많은 데이터가 필요할까?

수천 명의 작업자들이 각기 다른 집에서 서로 다른 방식으로 집안일을 수행하며 영상을 촬영하고 있는 상황에서, 일부 로봇공학 연구자들은 해당 데이터가 로봇을 안전하게 훈련시키기에 충분할 정도로 신뢰할 수 있는지에 대해 의문을 제기한다.

국제 표준 개발 기구인 ASTM 인터내셔널(ASTM International)의 애런 프래서(Aaron Prather) 로봇공학 전문가는 “가정에서 우리의 생활 방식이 항상 안전한 것은 아니다”라면서 “작업자들이 잘못된 습관을 로봇에 학습시켜 사고로 이어질 수 있다면 좋은 데이터라고 할 수 없을 것”이라고 지적했다. 또한 방대한 데이터가 수집되면서 품질 관리를 위한 검토 역시 점점 더 어려워지고 있다. 다만 안사리 CEO는 “위험한 방식으로 작업을 수행하는 영상은 승인하지 않으며, 서투른 동작은 오히려 로봇에게 ‘하지 말아야 할 행동’을 가르치는 데 유용할 수 있다”고 설명했다.

또 하나의 문제는 ‘과연 얼마나 많은 데이터가 필요한가?’이다. 마이크로1은 수만 시간 분량의 영상을 보유하고 있다고 밝혔으며, 앞서 언급한 데이터 기업 스케일AI는 10만 시간 이상의 데이터를 수집했다고 발표했다.

캘리포니아 대학교 버클리 캠퍼스(UC Berkeley)의 켄 골드버그(Ken Goldberg) 로봇공학 교수는 “유용한 수준에 도달하려면 오랜 시간이 걸릴 것”이라고 말했다. LLM은 인간이 읽는 데 10만 년이 걸릴 정도의 텍스트와 이미지로 학습했는데, 휴머노이드 로봇은 이보다 더 많은 데이터가 필요할 수도 있다. 로봇 관절을 제어하는 것은 텍스트를 생성하는 것보다 훨씬 더 복잡하기 때문이다. 골드버그 교수는 “사람들이 생각하는 것보다 훨씬 더 오래 걸릴 것”이라고 덧붙였다.

인도의 활기찬 기술 중심지에 사는 공학도 다투(Dattu)는 대학에서 하루 종일 수업을 마치고 집에 돌아오면 저녁도 거른 채 작은 발코니로 달려간다. 화분과 아령으로 가득 찬 좁은 공간에서 그는 아이폰을 이마에 고정하고 같은 옷을 반복해서 개는 모습을 촬영한다.

다투의 가족은 그런 모습을 의아하게 바라본다. 그는 “가족들은 내가 이해할 수 없는 일을 하고 있다고 생각한다”면서 “친구들에게 이 일을 설명하면 집안일을 촬영하는 것만으로 돈을 벌 수 있다는 사실에 모두 놀란다”고 설명했다.

대학 공부와 데이터 기록 작업, 그리고 다른 데이터 라벨링 일까지 병행하는 것은 그에게 부담이 된다. 그럼에도 그는 데이터 작업에 대해 “세상 사람들이 하는 것과는 무언가 다른 일을 하고 있는 듯한 느낌이 든다”고 말했다.

The post 휴머노이드 로봇 훈련시키는 ‘뜻밖의 주인공들’ appeared first on MIT 테크놀로지 리뷰 | MIT Technology Review Korea.

기술	득표율 (%)
휴머노이드 로봇	37
추론모델	24
인공자궁	23
무인전투기	16