Quasa
Установите приложение QUASA
Присоединяйся к пионеру Web3 крипто фриланса сейчас!
Открыть
Бизнес

Сбор данных для роботов — грязная, негламурная работа. Некоторые крупнейшие AI-лаборатории уже платят за это XDOF

|Автор: Вячеслав Васипенок|4 мин чтения| 9
Сбор данных для роботов — грязная, негламурная работа. Некоторые крупнейшие AI-лаборатории уже платят за это XDOF

Пока OpenAI, Google DeepMind и другие гиганты снова бросаются в робототехнику, одна из самых острых проблем отрасли остаётся почти невидимой. Роботам не хватает именно того, что есть у языковых моделей в избытке — качественных, масштабных данных для обучения.

Две недели назад OpenAI объявила о возобновлении своей робототехнической программы, которую закрыла ещё в 2021 году. Это очередной сигнал: физический мир становится следующим большим фронтиром искусственного интеллекта. Но чтобы роботы умели складывать футболки, открывать холодильники или помогать пожилым людям, им нужны не просто видео с YouTube. Им нужны данные о реальном физическом взаимодействии — и таких данных почти нет.Сбор данных для роботов

Именно на этом пробеле и построил свой бизнес стартап XDOF (произносится «экс-доф»), который сегодня выходит из стелс-режима. Компания уже привлекла $70 млн от Thrive Capital, Spark Capital, a16z, Lux и WndrCo. У неё около 60 сотрудников и уже 20 клиентов, включая несколько ведущих AI-лабораторий (пока без названий).

От Berkeley к миллионным инвестициям

Сооснователь и CEO Филипп Ву столкнулся с этой проблемой ещё во время PhD в UC Berkeley. Он пытался научить роботов осваивать навыки на больших датасетах — и быстро понял, что таких датасетов просто не существует.

"Всё упиралось в курицу и яйцо: сначала нужно было собрать данные, прежде чем вообще можно было думать о создании foundation model для робототехники, — рассказывает Ву".

Вместе с будущим сооснователем и CTO Фредом Шенту они разработали систему GELLO — недорогую систему телеоперации, которая позволяет человеку управлять роботизированной рукой и собирать качественные данные. Работа стала очень влиятельной в академическом сообществе.

Именно этот опыт и лёг в основу XDOF, которую запустили в октябре 2024 года вместе с третьим сооснователем, COO Немо Джином.

Что именно продаёт XDOF

Компания строит целую экосистему сбора, очистки, аннотации и организации данных для обучения роботов. Они работают сразу на трёх уровнях «пирамиды данных»:

  1. Самые ценные данные — телеоперация на тех же роботах, которые потом будут использоваться в реальности.
  2. Следующий уровень — более общие данные, собранные через системы вроде GELLO.
  3. Третий уровень — эгоцентрические данные, когда человек сам выполняет повседневные действия, а данные собираются через специальные носимые сенсоры (XDOF планирует делать свои).

Особенно важно, что компания не просто «собирает видео». Она строит полноценный цикл обратной связи: данные $\rightarrow$ обучение $\rightarrow$ улучшение процесса сбора $\rightarrow$ новые, ещё более качественные данные.

Почему лаборатории сами это не делаютСбор данных для роботов

По словам Ву, для серьёзного сбора данных нужна огромная инфраструктура: склады в сотни тысяч квадратных футов, сотни роботов, постоянная калибровка, обучение операторов. Это капиталоёмкая и операционно сложная работа, которую большинство AI-лабораторий предпочитают отдавать на аутсорс.

Все топовые лаборатории сейчас активно развивают робототехнику, — говорит Ву. — Они уже видели, что бывает, когда слишком поздно начинаешь гонку в языковых моделях. Никто не хочет оказаться в такой же ситуации с физическим ИИ.

Крупнейший открытый датасет для робототехники

Вместе с лабораторией ИИ в UC Berkeley компания выпускает то, что называет одним из самых больших высококачественных датасетов для обучения роботов — ABC. В него входят 130 000 траекторий манипуляций, 300 часов симуляции и 100 часов оценок. Раньше такого объёма качественных данных у академического сообщества просто не было.

Уже на этих данных роботы научились выполнять задачи вроде складывания футболок и загрузки AirPods в кейс.

Название с амбициями

Название XDOF — это игра со словами. В робототехнике DOF (degrees of freedom) означает степени свободы — количество независимых движений, которые может совершать робот. У человеческой руки их семь, у последних гуманоидов Figure — уже 30. Буква X в названии компании символизирует «произвольные», «неограниченные» степени свободы.

Главный вывод

XDOF планирует нанимать и обучать целые армии операторов по всему миру — как для телеоперации, так и для сбора эгоцентрических данных через носимые устройства. Работа грязная, физическая и совершенно не гламурная. Но именно она, по мнению компании, станет одним из ключевых конкурентных преимуществ в гонке за физический ИИ.

Пока большие лаборатории соревнуются в размере моделей и количестве GPU, XDOF делает ставку на то, что в ближайшие годы самым ценным ресурсом станет именно качественный «физический» датасет. И, судя по сумме инвестиций и списку инвесторов, многие уже с этим согласны.

Также читать:

Социальные сети переходят под контроль пользователей: алгоритмы теперь можно «тренировать» самому

80% дата-центров мира под ударом климата: новое исследование бьёт тревогу

Поделиться:

Подпишитесь на рассылку

Получайте свежие новости Web3, AI и криптовалют прямо на вашу почту.

0