Пока OpenAI, Google DeepMind и другие гиганты снова бросаются в робототехнику, одна из самых острых проблем отрасли остаётся почти невидимой. Роботам не хватает именно того, что есть у языковых моделей в избытке — качественных, масштабных данных для обучения.
Именно на этом пробеле и построил свой бизнес стартап XDOF (произносится «экс-доф»), который сегодня выходит из стелс-режима. Компания уже привлекла $70 млн от Thrive Capital, Spark Capital, a16z, Lux и WndrCo. У неё около 60 сотрудников и уже 20 клиентов, включая несколько ведущих AI-лабораторий (пока без названий).
От Berkeley к миллионным инвестициям
Сооснователь и CEO Филипп Ву столкнулся с этой проблемой ещё во время PhD в UC Berkeley. Он пытался научить роботов осваивать навыки на больших датасетах — и быстро понял, что таких датасетов просто не существует.
"Всё упиралось в курицу и яйцо: сначала нужно было собрать данные, прежде чем вообще можно было думать о создании foundation model для робототехники, — рассказывает Ву".
Вместе с будущим сооснователем и CTO Фредом Шенту они разработали систему GELLO — недорогую систему телеоперации, которая позволяет человеку управлять роботизированной рукой и собирать качественные данные. Работа стала очень влиятельной в академическом сообществе.
Именно этот опыт и лёг в основу XDOF, которую запустили в октябре 2024 года вместе с третьим сооснователем, COO Немо Джином.
Что именно продаёт XDOF
Компания строит целую экосистему сбора, очистки, аннотации и организации данных для обучения роботов. Они работают сразу на трёх уровнях «пирамиды данных»:
Самые ценные данные — телеоперация на тех же роботах, которые потом будут использоваться в реальности.
Следующий уровень — более общие данные, собранные через системы вроде GELLO.
Третий уровень — эгоцентрические данные, когда человек сам выполняет повседневные действия, а данные собираются через специальные носимые сенсоры (XDOF планирует делать свои).
Особенно важно, что компания не просто «собирает видео». Она строит полноценный цикл обратной связи: данные $\rightarrow$ обучение $\rightarrow$ улучшение процесса сбора $\rightarrow$ новые, ещё более качественные данные.
Почему лаборатории сами это не делают
По словам Ву, для серьёзного сбора данных нужна огромная инфраструктура: склады в сотни тысяч квадратных футов, сотни роботов, постоянная калибровка, обучение операторов. Это капиталоёмкая и операционно сложная работа, которую большинство AI-лабораторий предпочитают отдавать на аутсорс.
Все топовые лаборатории сейчас активно развивают робототехнику, — говорит Ву. — Они уже видели, что бывает, когда слишком поздно начинаешь гонку в языковых моделях. Никто не хочет оказаться в такой же ситуации с физическим ИИ.
Крупнейший открытый датасет для робототехники
Вместе с лабораторией ИИ в UC Berkeley компания выпускает то, что называет одним из самых больших высококачественных датасетов для обучения роботов — ABC. В него входят 130 000 траекторий манипуляций, 300 часов симуляции и 100 часов оценок. Раньше такого объёма качественных данных у академического сообщества просто не было.
Уже на этих данных роботы научились выполнять задачи вроде складывания футболок и загрузки AirPods в кейс.
Название с амбициями
Название XDOF — это игра со словами. В робототехнике DOF (degrees of freedom) означает степени свободы — количество независимых движений, которые может совершать робот. У человеческой руки их семь, у последних гуманоидов Figure — уже 30. Буква X в названии компании символизирует «произвольные», «неограниченные» степени свободы.
Главный вывод
XDOF планирует нанимать и обучать целые армии операторов по всему миру — как для телеоперации, так и для сбора эгоцентрических данных через носимые устройства. Работа грязная, физическая и совершенно не гламурная. Но именно она, по мнению компании, станет одним из ключевых конкурентных преимуществ в гонке за физический ИИ.
Пока большие лаборатории соревнуются в размере моделей и количестве GPU, XDOF делает ставку на то, что в ближайшие годы самым ценным ресурсом станет именно качественный «физический» датасет. И, судя по сумме инвестиций и списку инвесторов, многие уже с этим согласны.