Помните игроков, у которых было сотни подростков, играющих в Axie Infinity, чтобы заработать Магические Любовные Зелья?
Да, это было 4 года назад.
Теперь вы можете просто обучить и запустить 100 Автономных Кодек Операторов, чтобы они играли за вас
...и монетизировать это и продавать другим
✅ ИИ x Робототехника
Наратив ИИ x Робототехника действительно разогревается с моделями VLA
На этом этапе в экосистеме ИИ большинство протоколов и агентов используют текстовые LLM-движки или статические скриншоты для интерпретации данных
Но просто помните, что большая часть реального мира не имеет доступа к API, вам нужно видение, решения и действия. Реальный мир должен быть виден в пикселях, и здесь приходят модели VLA
@Codecopenflow позволяет автоматизировать программное обеспечение и робототехнику через видение, используя стек технологий, созданный с нуля
✅ Операторы CODEC
Операторы — это автономные программные агенты, которые могут выполнять задачи через цикл восприятия-рассуждения-действия. Возможность видеть экран (или видеопотоки с камер или данные датчиков) позволяет им принимать решения, которые LLM не смогли бы сделать
• Восприятие: захватывает скриншоты, видеопотоки с камер или данные датчиков
• Рассуждение: обрабатывает наблюдения и инструкции, используя модели языка и видения
• Действие: выполняет решения через взаимодействие с пользовательским интерфейсом или управление оборудованием
В непрерывном цикле
Операторы могут работать на серверах с bare-metal, виртуальных машинах (на любой операционной системе) или даже на роботах.
Каждый оператор автоматически получает выделенную вычислительную машину (изолированную ВМ или контейнерный экземпляр) и может быть защищен TEE (аппаратная изоляция) для чувствительного кода и данных.
✅ Уровень ИИ
Операторы могут быть настроены на использование одной или нескольких моделей (LLM или VLA), объединенных как их "мозг"
Например, сочетание недорогой языковой модели Mixtral-8×7B с открытой моделью видения CogVLM позволяет Операторам читать текст на экране и интерпретировать живые видеопотоки с экрана или камеры - все это за небольшую часть стоимости GPT-4.
Модель VLA (Видение-Язык-Действие) позволяет агенту интерпретировать визуальный ввод, а затем принимать решение о действии на основе того, что он видит
✅ Примеры использования
🔹 Автоматизация рабочего стола
Может автоматизировать повторяющиеся офисные задачи, управляя GUI. Например, заполнение таблиц, обновление календарей или другие задачи, требующие взаимодействия с GUI
Может обрабатывать обновления UI, так как на самом деле видит, что делает
🔹 Игровые агенты
Операторы могут управлять игроками или тестировать видеоигры. Агенты транслируют экран и могут выполнять действия на основе того, что они видят, отправляя команды клавиатуры или мыши в игру.
Может использоваться для тестирования качества, или даже для создания продвинутых NPC-соперников или автоматизации игр web3
🔹 Робототехника
Операторы могут управлять физическими роботами. Машинный уровень будет подключаться к аппаратному обеспечению робота с датчиками и актуаторами, и агент может отправлять команды для движения руки или навигации.
Например, он может захватывать видеопоток объектов, движущихся по конвейерной ленте, и выполнять действия на основе движения. Если на пути есть препятствие, Оператор может его увидеть и управлять роботом, чтобы избежать его
✅ Сбор данных и безопасность на блокчейне
Перенос информации Операторов на блокчейн Solana позволяет им предлагать неизменяемые журналы действий от всех выполненных действий
В будущем мы можем увидеть момент, когда компаниям по производству роботов потребуется ставить токены, чтобы гарантировать, что их Операторы не заставят робота вступать в физический контакт с человеком с силой выше определенного уровня. Если они нарушат это, их накажут за часть ставленного токена (как EigenLayer / Symbiotic restaking)
✅ Учебная среда для робототехники
С Codec не обученные виртуальные модели могут быть развернуты в динамичной, высококачественной учебной среде, без необходимости в физическом роботе.
Симулируйте, обучайте и уточняйте сложные поведения в облачном масштабе, а затем с уверенностью переносите эти политики на реальное оборудование.
Учебные среды могут быть быстро развернуты для всех типов Операторов (Программные, Игровые или Робототехнические)
✅ Codec SDK
Полный SDK и API были разработаны, чтобы разработчики могли легко развертывать своих Операторов
✅ Рынок Операторов
Операторы могут (в будущем) продаваться на специализированном рынке.
Будет разделение доходов, чтобы вы могли отправлять и монетизировать своего VLA оператора, что означает, что если вы обучите эффективных Операторов, вы сможете получить дополнительные источники дохода
✅ Заключительные мысли
Я думаю, что в следующем году мы увидим массовые разработки в области VLA. Мы видели, как быстро развиваются LLM, всего несколько лет назад был запущен GPT-1. Робототехника и модели видения, вероятно, станут горячей темой в какой-то момент этого цикла, и мне нравится быть на ранней стадии
О, и упомянул ли я, что соучредитель из Hugging Face и Elixir games 👀
Примечание: Slappjakke имеет большие пакеты $CODEC, и это один из тех случаев, когда я стал еще более оптимистичным, пока писал эту тему и добавил еще больше
Как всегда, это не финансовый совет и высокорисковая инвестиция, поэтому проводите собственное исследование.
Показать оригинал



8,9 тыс.
105
Содержание этой страницы предоставляется третьими сторонами. OKX не является автором цитируемых статей и не имеет на них авторских прав, если не указано иное. Материалы предоставляются исключительно в информационных целях и не отражают мнения OKX. Материалы не являются инвестиционным советом и призывом к покупке или продаже цифровых активов. Раздел использует ИИ для создания обзоров и кратких содержаний предоставленных материалов. Обратите внимание, что информация, сгенерированная ИИ, может быть неточной и непоследовательной. Для получения полной информации изучите соответствующую оригинальную статью. OKX не несет ответственности за материалы, содержащиеся на сторонних сайтах. Цифровые активы, в том числе стейблкоины и NFT, подвержены высокому риску, а их стоимость может сильно колебаться. Перед торговлей и покупкой цифровых активов оцените ваше финансовое состояние и принимайте только взвешенные решения.