Шифрування технологій буде сприяти розвитку індустрії Ботів, забезпечуючи економічні гарантії безпеки для Ботів, а також оптимізуючи їхню інфраструктуру підключення, затримку та процеси збору даних.
Автор: Paul Veradittakit, партнер, Pantera Capital
Переклад: xiaozou, Золотий фінансовий
Резюме:
Інновації та масштабний ефект VLA сприяють появі економічних, ефективних та універсальних гуманоїдних роботів.
З розширенням ринку споживчих роботів для складських Ботів варто глибше дослідити питання безпеки Ботів, фінансування та механізмів оцінки.
Шифрування технологій забезпечить економічні гарантії для Ботів, оптимізуючи їхню інфраструктуру підключення, затримку та процеси збору даних, що сприятиме розвитку індустрії Ботів.
ChatGPT повністю переписав людське сприйняття очікувань від штучного інтелекту. Коли великі мовні моделі почали взаємодіяти з зовнішнім програмним світом, багато хто вважав, що AI агенти є остаточною формою. Але якщо згадати класичні науково-фантастичні фільми, такі як «Зоряні війни», «Той, що біжить по лезу» або «Робокоп», можна зрозуміти, що людство насправді мріє про те, щоб штучний інтелект міг взаємодіяти з фізичним світом у формі роботів.
На думку Pantera Capital, у сфері Ботів наближається «момент ChatGPT». Спочатку ми проаналізуємо, як прориви в штучному інтелекті за останні кілька років змінили галузеву картину, а потім розглянемо, як технології батарей, затримка оптимізації та поліпшення збору даних формуватимуть майбутнє, а також роль шифрування в цьому процесі. Нарешті, ми пояснимо, чому вважаємо, що безпека Ботів, фінансування, оцінка та освіта є вертикалями, на які слід звернути особливу увагу.
1. Елементи трансформації
(1) Прорив штучного інтелекту
Прогрес у сфері мультимодальних великих мовних моделей надає ботам необхідний «мозок» для виконання складних завдань. Боти в основному сприймають навколишнє середовище через два сенсори: зір і слух.
Традиційні моделі комп'ютерного зору (такі як згорткові нейронні мережі), хоча й добре справляються з завданнями виявлення або класифікації об'єктів, проте їм складно перетворити візуальну інформацію на цілеспрямовані інструкції для дій. Великі мовні моделі, хоча й демонструють відмінні результати в розумінні та генерації тексту, проте обмежені в своїй здатності сприймати фізичний світ.
!
За допомогою моделі зорово-мовно-діяльнісної (VLA) боти змогли інтегрувати зорове сприйняття, мовне розуміння та фізичні дії в єдиній обчислювальній рамці. У лютому 2025 року Figure AI випустила універсальну модель керування гуманоїдними роботами Helix, яка встановила нові стандарти для галузі завдяки можливостям нульового навчання та архітектурі системи 1/системи 2. Особливість нульового навчання дозволяє ботам миттєво адаптуватися до нових сцен, нових об'єктів та нових команд без необхідності повторного навчання для кожного завдання. Архітектура системи 1/системи 2 розділяє високорівневе мислення та легковаге міркування, що дозволяє реалізувати комерційних гуманоїдних роботів з людським мисленням та миттєвою точністю.
(2)Економічні Боти стають реальністю
Технології, які змінюють світ, мають одну спільну рису — доступність. Смартфони, персональні комп'ютери, технології 3D-друку стали доступними за цінами, які можуть дозволити собі представники середнього класу. Коли ціна на роботів, таких як Unitree G1, буде нижчою за ціну Honda Accord або мінімальний річний дохід у 34 тисячі доларів США, не дивно уявляти світ, де фізичну працю та повсякденні справи переважно виконують роботи.
!
(3)з складу до споживчого ринку
Боти технології поступово переходять від рішень для складів до споживчої сфери. Цей світ створено для людей — люди можуть виконувати всі роботи професійних роботів, тоді як професійні роботи не можуть виконувати всі роботи людей. Компанії з виробництва роботів більше не обмежуються виготовленням роботів для заводів, а переходять до розробки більш універсальних гуманоїдних роботів. Таким чином, передова технологія роботів більше не лише в складах, але й проникає в повсякденне життя.
Вартість є одним із основних вузьких місць масштабованості. Найбільш важливим показником для нас є інтегральна вартість на годину, яка розраховується як сума вартісних можливостей часу на навчання та зарядку, витрат на виконання завдань та вартості придбання Ботів, поділена на загальний час роботи Ботів. Ця вартість повинна бути нижчою за середній рівень заробітної плати в галузі, щоб бути конкурентоспроможною.
!
Щоб повністю проникнути в сферу складування, загальні витрати на Боти повинні бути нижчими за 31,39 долара США за годину. А в найбільшому споживчому сегменті – приватній освіті та сфері охорони здоров'я – ці витрати повинні контролюватися на рівні нижче 35,18 долара США. Наразі Боти розвиваються в напрямку більшої дешевизни, ефективності та універсальності.
2、Наступний прорив у технології Ботів
(1)Оптимізація акумулятора
Технологія акумуляторів завжди була вузьким місцем у дружніх до користувача Ботах. На початку, такі електромобілі, як BMW i3, через обмеження технології акумуляторів мали короткий пробіг, високу вартість і низьку практичність, що ускладнювало їхнє поширення; Боти стикаються з аналогічними труднощами. Бот Spot від Boston Dynamics має час автономної роботи всього 90 хвилин, акумулятор Unitree G1 забезпечує приблизно 2 години роботи. Користувачі, очевидно, не хочуть вручну заряджати кожні дві години, тому автономна зарядка та з'єднувальні інфраструктури стають важливими напрямками розвитку. Наразі основні способи заряджання Ботів - це заміна акумулятора або пряме заряджання.
Режим заміни батарей дозволяє здійснювати безперервну роботу шляхом швидкої заміни виснажених батарейних блоків, мінімізуючи час простою, і підходить для польових або заводських умов. Цей процес може виконуватись вручну або автоматизовано.
Індикаторна зарядка використовує бездротовий спосіб живлення, хоча повна зарядка займає більше часу, але легко реалізує повністю автоматизований процес.
(2)затримка оптимізація
Низька затримка операцій може бути розділена на два типи: сенсорне сприйняття та дистанційне керування. Сприйняття означає просторову пізнавальну здатність Ботів до навколишнього середовища, тоді як дистанційне керування специфічно означає реальний контроль оператора.
Згідно з дослідженням Cintrini, системи сприйняття Ботів починаються з дешевих датчиків, але технологічний бар'єр полягає в інтеграції програмного забезпечення, енергоефективних обчислень і мілісекундних контрольних контурів. Коли Боти завершують просторову локалізацію, легка нейронна мережа позначає такі елементи, як перешкоди, піддони або люди. Після введення міток сцени в систему планування миттєво генеруються команди двигунів, що надсилаються до стопи, колес або механічних рук. Затримка сприйняття менше 50 мілісекунд еквівалентна швидкості реакції людини — будь-яка затримка, що перевищує цей поріг, призводить до незграбності рухів Ботів. Тому 90% рішень повинні прийматися за допомогою єдиної локальної мережі зору - мови - дії.
Повністю автономні Боти повинні забезпечити високу продуктивність VLA моделі з затримкою менше 50 мілісекунд; для віддаленого керування Ботами вимога полягає в тому, щоб затримка сигналу між кінцем управління та Ботом не перевищувала 50 мілісекунд. Тут важливість VLA моделі особливо підкреслюється — якщо візуальний та текстовий вхід обробляються різними моделями, а потім вводяться в велику мовну модель, загальна затримка перевищить поріг у 50 мілісекунд.
(3)Оптимізація збору даних
Збір даних в основному має три шляхи: відеодані з реального світу, синтетичні дані та дані віддаленого управління. Основна проблема реальних та синтетичних даних полягає в подоланні різниці між фізичною поведінкою роботів та відео/модельними симуляціями. Реальні відеодані не містять фізичних деталей, таких як зворотний зв'язок, похибка руху суглобів та деформація матеріалів; симуляційні дані, в свою чергу, не мають непередбачуваних змінних, таких як відмови датчиків та коефіцієнт тертя.
Найперспективніший спосіб збору даних — це дистанційне керування — коли оператори дистанційно контролюють Боти для виконання завдань. Але витрати на працю є основним обмежуючим фактором збору даних за допомогою дистанційного керування.
Розробка апаратного забезпечення на замовлення також пропонує нові рішення для збору високоякісних даних. Компанія Mecka поєднує традиційні методи з апаратним забезпеченням на замовлення, збираючи багатовимірні дані про рухи людини, які після обробки перетворюються на набори даних, придатні для навчання нейронних мереж Ботів, разом з швидким циклом ітерацій для навчання AI Ботів, забезпечуючи величезні обсяги високоякісних даних. Ці технологічні канали спільно скорочують шлях перетворення від сирих даних до розгорнутого Бота.
3、основні сфери дослідження
(1)шифрування технологій та Боти
Технологія шифрування може стимулювати недовірені сторони підвищувати ефективність мережі Ботів. На основі вищезгаданих ключових областей, ми вважаємо, що шифрування може підвищити ефективність у трьох аспектах: інтеграція інфраструктури, оптимізація затримки та збір даних.
Децентралізована фізична інфраструктурна мережа (DePIN) має потенціал революціонізувати інфраструктуру зарядки. Коли гуманоїдні роботи будуть працювати по всьому світу, зарядні станції повинні бути так само доступні, як автозаправні станції. Централізовані мережі потребують величезних попередніх інвестицій, тоді як DePIN розподілить витрати між операторами вузлів, що дозволить швидко розширити зарядну інфраструктуру в більшій кількості регіонів.
DePIN також може використовувати розподілену інфраструктуру для оптимізації затримки віддаленого керування. Завдяки агрегуванню географічно розподілених ресурсів обчислювальних вузлів, команди віддаленого керування можуть оброблятися локальними або найближчими доступними вузлами, що максимізує скорочення відстані передачі даних і суттєво знижує затримку зв'язку. Але нинішні проекти DePIN в основному зосереджені на децентралізованому зберіганні, розподілі вмісту та обміні пропускною здатністю, хоча і є проекти, що демонструють переваги країн обчислень у потоковій передачі або Інтернеті речей, ще не було розширено на боти або віддалене керування.
Віддалене управління є найбільш перспективним способом збору даних, але централізовані сутності витрачають великі кошти на залучення професіоналів для збору даних. DePIN вирішує цю проблему, заохочуючи треті сторони надавати віддалені дані за допомогою шифрування токенів. Проект Reborn створює глобальну мережу віддалених операторів, перетворюючи їх внесок на токенізовані цифрові активи, формуючи децентралізовану систему без дозволів — учасники можуть отримувати прибуток, а також брати участь в управлінні і допомагати в навчанні AGI Ботів.
(2)Безпека завжди є основним турботою
Кінцева мета технології Ботів полягає в досягненні повної автономії, але, як попереджає серія фільмів «Термінатор», людство найменше бажає бачити, щоб автономність перетворювала Ботів на агресивну зброю. Проблеми безпеки великих мовних моделей викликали занепокоєння, і коли ці моделі отримують здатність до фізичних дій, безпека Ботів стає ключовою передумовою для соціальної прийнятності.
Економічна безпека є одним із стовпів процвітання екосистеми Ботів. Компанія OpenMind у цій сфері створює FABRIC — децентралізований рівень координації машин, який реалізує автентифікацію ідентичності пристроїв, верифікацію фізичної присутності та отримання ресурсів за допомогою шифрування. На відміну від простого управління ринком завдань, FABRIC дозволяє Ботам самостійно підтверджувати інформацію про ідентичність, геолокацію та поведінкові записи без залежності від централізованих посередників.
Поведінкові обмеження та ідентифікація виконуються за допомогою механізмів на блокчейні, що забезпечує можливість аудиту відповідності для всіх. Боти, які відповідають стандартам безпеки, вимогам якості та регіональним нормам, отримають винагороди, тоді як порушники зіткнуться з покараннями або втратою кваліфікації, що дозволить встановити механізми підзвітності та довіри в мережі автономних машин.
Треті особи, такі як Symbiotic, також можуть надати рівноцінні гарантії безпеки. Хоча система параметрів покарання все ще потребує вдосконалення, відповідні технології вже перейшли в практичну стадію. Ми очікуємо, що галузеві стандарти безпеки незабаром будуть сформовані, і в той час параметри покарання будуть змодельовані відповідно до цих стандартів.
Приклад реалізації:
Боти компанії приєдналися до мережі Symbiotic.
Встановіть параметри конфіскації, які можна перевірити (наприклад, «застосування людської сили понад 2500 Н»);
Стейкери надають заставу, щоб забезпечити, що боти дотримуються параметрів;
У разі порушення, застава буде використана як компенсація жертвам.
Цей режим не лише стимулює компанії ставити безпеку на перше місце, але й сприяє прийняттю споживачами через механізм страхування пулу стейкінгу.
Symbiotic команда має такі погляди на сферу Ботів:
Симбіотична універсальна рамка стейкінгу має на меті розширити концепцію стейкінгу на всі сфери, які потребують економічного забезпечення, незалежно від того, через спільну чи незалежну модель. Її застосування варіюється від страхування до робототехніки і вимагає конкретного дизайну на основі конкретних випадків. Наприклад, мережа роботів може бути повністю побудована на основі симбіотичної рамки, що дозволяє зацікавленим сторонам забезпечити економічні гарантії цілісності мережі.
4、заповнити прогалини в технологічному стеку Ботів
OpenAI сприяло популяризації AI, але основа ChatGPT вже була закладена. Хмарні сервіси зламали залежність моделі від локальної обчислювальної потужності, Huggingface реалізував відкритий код моделі, а Kaggle надав експериментальну платформу для AI інженерів. Ці поступові прориви спільно сприяли масовій популяризації AI.
На відміну від AI, у сфері ботів важко почати, коли ресурси обмежені. Щоб забезпечити поширення ботів, бар'єри для їх розробки повинні бути знижені до зручності, подібної до розробки додатків AI. Ми вважаємо, що існує простір для покращення на трьох рівнях: механізми фінансування, системи оцінки та освітня екосистема.
Фінансування є болючою проблемою у сфері Ботів. Розробка комп'ютерних програм потребує лише одного комп'ютера та хмарних обчислювальних ресурсів, тоді як для створення функціонального робота необхідно придбати двигуни, датчики, акумулятори та інше обладнання, вартість якого легко перевищує 100 тисяч доларів. Ця апаратна природа робить розробку роботів менш гнучкою та дорогою в порівнянні з AI.
Інфраструктура оцінки Ботів у реальних сценаріях ще знаходиться на стадії зародження. У сфері штучного інтелекту вже створена чітка система функцій втрат, тестування може бути повністю віртуалізоване. Але відмінні віртуальні стратегії не можуть бути безпосередньо перетворені на ефективні рішення в реальному світі. Ботам необхідно тестувати оцінку автономних стратегій в різноманітних реальних умовах, щоб досягти ітеративної оптимізації.
Коли ця інфраструктура стане зрілою, спеціалісти масово приєднаються, а гуманоїдні роботи повторять криву вибуху Web2. Компанія, що займається шифруванням роботів OpenMind, просувається в цьому напрямку — її відкритий проект OM1 («роботизована версія Android-системи») перетворює первинне апаратне забезпечення на економічно свідомі модернізовані інтелекти. Візуальні, мовні та модулі планування рухів можуть підключатися, як мобільні додатки, всі етапи міркування представлені зрозумілою англійською мовою, що дозволяє операторам аудиторувати або коригувати поведінку без необхідності звертатися до прошивки. Ця здатність до міркування природною мовою дозволяє новому поколінню спеціалістів безперешкодно входити у сферу робототехніки, роблячи вирішальний крок до створення відкритої платформи для вибуху революції роботів, як це робить відкритий рух для прискорення AI.
!
Щільність кадрів визначає траєкторію галузі. Структурована система доступної освіти є надзвичайно важливою для постачання кадрів у сфері Ботів. Вихід OpenMind на біржу Nasdaq знаменує початок нової ери, в якій розумні машини беруть участь у фінансових інноваціях та реальній освіті. OpenMind у співпраці з Robostore оголосили про запуск першого універсального освітнього курсу на основі гуманоїдного робота Unitree G1 у державних школах K-12 США. Цей курс розроблений з урахуванням платформеної незалежності і може адаптуватися до різних форм роботів, надаючи студентам можливість для практичних занять. Цей позитивний сигнал зміцнює наше переконання: у найближчі кілька років рівень ресурсів у сфері освіти Ботів буде порівнянний з рівнем у сфері AI.
5、Перспективи на майбутнє
Інновації та ефекти економії від масштабу моделі зору - мови - дії (VLA) призвели до появи економічно вигідних, ефективних та універсальних гуманоїдних Ботів. В міру того, як складські Боти розширюються на ринок споживчих товарів, безпека, моделі фінансування та системи оцінки стають ключовими напрямками дослідження. Ми твердо віримо, що шифрування технологій сприятиме розвитку Ботів трьома шляхами: забезпечуючи економічні гарантії безпеки, оптимізуючи інфраструктуру зарядки, покращуючи затримку та канали збору даних.
Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
Партнер Pantera: ера Ботів, що працюють на основі шифрування
Автор: Paul Veradittakit, партнер, Pantera Capital
Переклад: xiaozou, Золотий фінансовий
Резюме:
Інновації та масштабний ефект VLA сприяють появі економічних, ефективних та універсальних гуманоїдних роботів.
З розширенням ринку споживчих роботів для складських Ботів варто глибше дослідити питання безпеки Ботів, фінансування та механізмів оцінки.
Шифрування технологій забезпечить економічні гарантії для Ботів, оптимізуючи їхню інфраструктуру підключення, затримку та процеси збору даних, що сприятиме розвитку індустрії Ботів.
ChatGPT повністю переписав людське сприйняття очікувань від штучного інтелекту. Коли великі мовні моделі почали взаємодіяти з зовнішнім програмним світом, багато хто вважав, що AI агенти є остаточною формою. Але якщо згадати класичні науково-фантастичні фільми, такі як «Зоряні війни», «Той, що біжить по лезу» або «Робокоп», можна зрозуміти, що людство насправді мріє про те, щоб штучний інтелект міг взаємодіяти з фізичним світом у формі роботів.
На думку Pantera Capital, у сфері Ботів наближається «момент ChatGPT». Спочатку ми проаналізуємо, як прориви в штучному інтелекті за останні кілька років змінили галузеву картину, а потім розглянемо, як технології батарей, затримка оптимізації та поліпшення збору даних формуватимуть майбутнє, а також роль шифрування в цьому процесі. Нарешті, ми пояснимо, чому вважаємо, що безпека Ботів, фінансування, оцінка та освіта є вертикалями, на які слід звернути особливу увагу.
1. Елементи трансформації
(1) Прорив штучного інтелекту
Прогрес у сфері мультимодальних великих мовних моделей надає ботам необхідний «мозок» для виконання складних завдань. Боти в основному сприймають навколишнє середовище через два сенсори: зір і слух.
Традиційні моделі комп'ютерного зору (такі як згорткові нейронні мережі), хоча й добре справляються з завданнями виявлення або класифікації об'єктів, проте їм складно перетворити візуальну інформацію на цілеспрямовані інструкції для дій. Великі мовні моделі, хоча й демонструють відмінні результати в розумінні та генерації тексту, проте обмежені в своїй здатності сприймати фізичний світ.
!
За допомогою моделі зорово-мовно-діяльнісної (VLA) боти змогли інтегрувати зорове сприйняття, мовне розуміння та фізичні дії в єдиній обчислювальній рамці. У лютому 2025 року Figure AI випустила універсальну модель керування гуманоїдними роботами Helix, яка встановила нові стандарти для галузі завдяки можливостям нульового навчання та архітектурі системи 1/системи 2. Особливість нульового навчання дозволяє ботам миттєво адаптуватися до нових сцен, нових об'єктів та нових команд без необхідності повторного навчання для кожного завдання. Архітектура системи 1/системи 2 розділяє високорівневе мислення та легковаге міркування, що дозволяє реалізувати комерційних гуманоїдних роботів з людським мисленням та миттєвою точністю.
(2)Економічні Боти стають реальністю
Технології, які змінюють світ, мають одну спільну рису — доступність. Смартфони, персональні комп'ютери, технології 3D-друку стали доступними за цінами, які можуть дозволити собі представники середнього класу. Коли ціна на роботів, таких як Unitree G1, буде нижчою за ціну Honda Accord або мінімальний річний дохід у 34 тисячі доларів США, не дивно уявляти світ, де фізичну працю та повсякденні справи переважно виконують роботи.
!
(3)з складу до споживчого ринку
Боти технології поступово переходять від рішень для складів до споживчої сфери. Цей світ створено для людей — люди можуть виконувати всі роботи професійних роботів, тоді як професійні роботи не можуть виконувати всі роботи людей. Компанії з виробництва роботів більше не обмежуються виготовленням роботів для заводів, а переходять до розробки більш універсальних гуманоїдних роботів. Таким чином, передова технологія роботів більше не лише в складах, але й проникає в повсякденне життя.
Вартість є одним із основних вузьких місць масштабованості. Найбільш важливим показником для нас є інтегральна вартість на годину, яка розраховується як сума вартісних можливостей часу на навчання та зарядку, витрат на виконання завдань та вартості придбання Ботів, поділена на загальний час роботи Ботів. Ця вартість повинна бути нижчою за середній рівень заробітної плати в галузі, щоб бути конкурентоспроможною.
!
Щоб повністю проникнути в сферу складування, загальні витрати на Боти повинні бути нижчими за 31,39 долара США за годину. А в найбільшому споживчому сегменті – приватній освіті та сфері охорони здоров'я – ці витрати повинні контролюватися на рівні нижче 35,18 долара США. Наразі Боти розвиваються в напрямку більшої дешевизни, ефективності та універсальності.
2、Наступний прорив у технології Ботів
(1)Оптимізація акумулятора
Технологія акумуляторів завжди була вузьким місцем у дружніх до користувача Ботах. На початку, такі електромобілі, як BMW i3, через обмеження технології акумуляторів мали короткий пробіг, високу вартість і низьку практичність, що ускладнювало їхнє поширення; Боти стикаються з аналогічними труднощами. Бот Spot від Boston Dynamics має час автономної роботи всього 90 хвилин, акумулятор Unitree G1 забезпечує приблизно 2 години роботи. Користувачі, очевидно, не хочуть вручну заряджати кожні дві години, тому автономна зарядка та з'єднувальні інфраструктури стають важливими напрямками розвитку. Наразі основні способи заряджання Ботів - це заміна акумулятора або пряме заряджання.
Режим заміни батарей дозволяє здійснювати безперервну роботу шляхом швидкої заміни виснажених батарейних блоків, мінімізуючи час простою, і підходить для польових або заводських умов. Цей процес може виконуватись вручну або автоматизовано.
Індикаторна зарядка використовує бездротовий спосіб живлення, хоча повна зарядка займає більше часу, але легко реалізує повністю автоматизований процес.
(2)затримка оптимізація
Низька затримка операцій може бути розділена на два типи: сенсорне сприйняття та дистанційне керування. Сприйняття означає просторову пізнавальну здатність Ботів до навколишнього середовища, тоді як дистанційне керування специфічно означає реальний контроль оператора.
Згідно з дослідженням Cintrini, системи сприйняття Ботів починаються з дешевих датчиків, але технологічний бар'єр полягає в інтеграції програмного забезпечення, енергоефективних обчислень і мілісекундних контрольних контурів. Коли Боти завершують просторову локалізацію, легка нейронна мережа позначає такі елементи, як перешкоди, піддони або люди. Після введення міток сцени в систему планування миттєво генеруються команди двигунів, що надсилаються до стопи, колес або механічних рук. Затримка сприйняття менше 50 мілісекунд еквівалентна швидкості реакції людини — будь-яка затримка, що перевищує цей поріг, призводить до незграбності рухів Ботів. Тому 90% рішень повинні прийматися за допомогою єдиної локальної мережі зору - мови - дії.
Повністю автономні Боти повинні забезпечити високу продуктивність VLA моделі з затримкою менше 50 мілісекунд; для віддаленого керування Ботами вимога полягає в тому, щоб затримка сигналу між кінцем управління та Ботом не перевищувала 50 мілісекунд. Тут важливість VLA моделі особливо підкреслюється — якщо візуальний та текстовий вхід обробляються різними моделями, а потім вводяться в велику мовну модель, загальна затримка перевищить поріг у 50 мілісекунд.
(3)Оптимізація збору даних
Збір даних в основному має три шляхи: відеодані з реального світу, синтетичні дані та дані віддаленого управління. Основна проблема реальних та синтетичних даних полягає в подоланні різниці між фізичною поведінкою роботів та відео/модельними симуляціями. Реальні відеодані не містять фізичних деталей, таких як зворотний зв'язок, похибка руху суглобів та деформація матеріалів; симуляційні дані, в свою чергу, не мають непередбачуваних змінних, таких як відмови датчиків та коефіцієнт тертя.
Найперспективніший спосіб збору даних — це дистанційне керування — коли оператори дистанційно контролюють Боти для виконання завдань. Але витрати на працю є основним обмежуючим фактором збору даних за допомогою дистанційного керування.
Розробка апаратного забезпечення на замовлення також пропонує нові рішення для збору високоякісних даних. Компанія Mecka поєднує традиційні методи з апаратним забезпеченням на замовлення, збираючи багатовимірні дані про рухи людини, які після обробки перетворюються на набори даних, придатні для навчання нейронних мереж Ботів, разом з швидким циклом ітерацій для навчання AI Ботів, забезпечуючи величезні обсяги високоякісних даних. Ці технологічні канали спільно скорочують шлях перетворення від сирих даних до розгорнутого Бота.
3、основні сфери дослідження
(1)шифрування технологій та Боти
Технологія шифрування може стимулювати недовірені сторони підвищувати ефективність мережі Ботів. На основі вищезгаданих ключових областей, ми вважаємо, що шифрування може підвищити ефективність у трьох аспектах: інтеграція інфраструктури, оптимізація затримки та збір даних.
Децентралізована фізична інфраструктурна мережа (DePIN) має потенціал революціонізувати інфраструктуру зарядки. Коли гуманоїдні роботи будуть працювати по всьому світу, зарядні станції повинні бути так само доступні, як автозаправні станції. Централізовані мережі потребують величезних попередніх інвестицій, тоді як DePIN розподілить витрати між операторами вузлів, що дозволить швидко розширити зарядну інфраструктуру в більшій кількості регіонів.
DePIN також може використовувати розподілену інфраструктуру для оптимізації затримки віддаленого керування. Завдяки агрегуванню географічно розподілених ресурсів обчислювальних вузлів, команди віддаленого керування можуть оброблятися локальними або найближчими доступними вузлами, що максимізує скорочення відстані передачі даних і суттєво знижує затримку зв'язку. Але нинішні проекти DePIN в основному зосереджені на децентралізованому зберіганні, розподілі вмісту та обміні пропускною здатністю, хоча і є проекти, що демонструють переваги країн обчислень у потоковій передачі або Інтернеті речей, ще не було розширено на боти або віддалене керування.
Віддалене управління є найбільш перспективним способом збору даних, але централізовані сутності витрачають великі кошти на залучення професіоналів для збору даних. DePIN вирішує цю проблему, заохочуючи треті сторони надавати віддалені дані за допомогою шифрування токенів. Проект Reborn створює глобальну мережу віддалених операторів, перетворюючи їх внесок на токенізовані цифрові активи, формуючи децентралізовану систему без дозволів — учасники можуть отримувати прибуток, а також брати участь в управлінні і допомагати в навчанні AGI Ботів.
(2)Безпека завжди є основним турботою
Кінцева мета технології Ботів полягає в досягненні повної автономії, але, як попереджає серія фільмів «Термінатор», людство найменше бажає бачити, щоб автономність перетворювала Ботів на агресивну зброю. Проблеми безпеки великих мовних моделей викликали занепокоєння, і коли ці моделі отримують здатність до фізичних дій, безпека Ботів стає ключовою передумовою для соціальної прийнятності.
Економічна безпека є одним із стовпів процвітання екосистеми Ботів. Компанія OpenMind у цій сфері створює FABRIC — децентралізований рівень координації машин, який реалізує автентифікацію ідентичності пристроїв, верифікацію фізичної присутності та отримання ресурсів за допомогою шифрування. На відміну від простого управління ринком завдань, FABRIC дозволяє Ботам самостійно підтверджувати інформацію про ідентичність, геолокацію та поведінкові записи без залежності від централізованих посередників.
Поведінкові обмеження та ідентифікація виконуються за допомогою механізмів на блокчейні, що забезпечує можливість аудиту відповідності для всіх. Боти, які відповідають стандартам безпеки, вимогам якості та регіональним нормам, отримають винагороди, тоді як порушники зіткнуться з покараннями або втратою кваліфікації, що дозволить встановити механізми підзвітності та довіри в мережі автономних машин.
Треті особи, такі як Symbiotic, також можуть надати рівноцінні гарантії безпеки. Хоча система параметрів покарання все ще потребує вдосконалення, відповідні технології вже перейшли в практичну стадію. Ми очікуємо, що галузеві стандарти безпеки незабаром будуть сформовані, і в той час параметри покарання будуть змодельовані відповідно до цих стандартів.
Приклад реалізації:
Цей режим не лише стимулює компанії ставити безпеку на перше місце, але й сприяє прийняттю споживачами через механізм страхування пулу стейкінгу.
Symbiotic команда має такі погляди на сферу Ботів:
Симбіотична універсальна рамка стейкінгу має на меті розширити концепцію стейкінгу на всі сфери, які потребують економічного забезпечення, незалежно від того, через спільну чи незалежну модель. Її застосування варіюється від страхування до робототехніки і вимагає конкретного дизайну на основі конкретних випадків. Наприклад, мережа роботів може бути повністю побудована на основі симбіотичної рамки, що дозволяє зацікавленим сторонам забезпечити економічні гарантії цілісності мережі.
4、заповнити прогалини в технологічному стеку Ботів
OpenAI сприяло популяризації AI, але основа ChatGPT вже була закладена. Хмарні сервіси зламали залежність моделі від локальної обчислювальної потужності, Huggingface реалізував відкритий код моделі, а Kaggle надав експериментальну платформу для AI інженерів. Ці поступові прориви спільно сприяли масовій популяризації AI.
На відміну від AI, у сфері ботів важко почати, коли ресурси обмежені. Щоб забезпечити поширення ботів, бар'єри для їх розробки повинні бути знижені до зручності, подібної до розробки додатків AI. Ми вважаємо, що існує простір для покращення на трьох рівнях: механізми фінансування, системи оцінки та освітня екосистема.
Фінансування є болючою проблемою у сфері Ботів. Розробка комп'ютерних програм потребує лише одного комп'ютера та хмарних обчислювальних ресурсів, тоді як для створення функціонального робота необхідно придбати двигуни, датчики, акумулятори та інше обладнання, вартість якого легко перевищує 100 тисяч доларів. Ця апаратна природа робить розробку роботів менш гнучкою та дорогою в порівнянні з AI.
Інфраструктура оцінки Ботів у реальних сценаріях ще знаходиться на стадії зародження. У сфері штучного інтелекту вже створена чітка система функцій втрат, тестування може бути повністю віртуалізоване. Але відмінні віртуальні стратегії не можуть бути безпосередньо перетворені на ефективні рішення в реальному світі. Ботам необхідно тестувати оцінку автономних стратегій в різноманітних реальних умовах, щоб досягти ітеративної оптимізації.
Коли ця інфраструктура стане зрілою, спеціалісти масово приєднаються, а гуманоїдні роботи повторять криву вибуху Web2. Компанія, що займається шифруванням роботів OpenMind, просувається в цьому напрямку — її відкритий проект OM1 («роботизована версія Android-системи») перетворює первинне апаратне забезпечення на економічно свідомі модернізовані інтелекти. Візуальні, мовні та модулі планування рухів можуть підключатися, як мобільні додатки, всі етапи міркування представлені зрозумілою англійською мовою, що дозволяє операторам аудиторувати або коригувати поведінку без необхідності звертатися до прошивки. Ця здатність до міркування природною мовою дозволяє новому поколінню спеціалістів безперешкодно входити у сферу робототехніки, роблячи вирішальний крок до створення відкритої платформи для вибуху революції роботів, як це робить відкритий рух для прискорення AI.
!
Щільність кадрів визначає траєкторію галузі. Структурована система доступної освіти є надзвичайно важливою для постачання кадрів у сфері Ботів. Вихід OpenMind на біржу Nasdaq знаменує початок нової ери, в якій розумні машини беруть участь у фінансових інноваціях та реальній освіті. OpenMind у співпраці з Robostore оголосили про запуск першого універсального освітнього курсу на основі гуманоїдного робота Unitree G1 у державних школах K-12 США. Цей курс розроблений з урахуванням платформеної незалежності і може адаптуватися до різних форм роботів, надаючи студентам можливість для практичних занять. Цей позитивний сигнал зміцнює наше переконання: у найближчі кілька років рівень ресурсів у сфері освіти Ботів буде порівнянний з рівнем у сфері AI.
5、Перспективи на майбутнє
Інновації та ефекти економії від масштабу моделі зору - мови - дії (VLA) призвели до появи економічно вигідних, ефективних та універсальних гуманоїдних Ботів. В міру того, як складські Боти розширюються на ринок споживчих товарів, безпека, моделі фінансування та системи оцінки стають ключовими напрямками дослідження. Ми твердо віримо, що шифрування технологій сприятиме розвитку Ботів трьома шляхами: забезпечуючи економічні гарантії безпеки, оптимізуючи інфраструктуру зарядки, покращуючи затримку та канали збору даних.