Pamiętasz graczy, którzy mieli setki nastolatków grających w Axie Infinity, aby zarabiać Magic Love Potions? Tak, to było 4 lata temu. Teraz możesz po prostu wyszkolić i uruchomić 100 autonomicznych operatorów kodeków, aby grali za Ciebie ...i zmonetyzować to oraz sprzedać innym ✅ AI x Robotyka Narracja AI x Robotyka naprawdę się rozgrzewa z modelami VLA ​ Na tym etapie ekosystemu AI większość protokołów i agentów korzysta z opartych na tekście silników LLM lub statycznych zrzutów ekranu do interpretacji danych ​ Ale pamiętaj, że większość rzeczywistego świata nie ma dostępu do API, potrzebujesz wizji, decyzji i działań. Rzeczywisty świat musi być widziany w pikselach i tutaj wkraczają modele VLA ​ @Codecopenflow umożliwia automatyzację oprogramowania i robotyki poprzez wizję, korzystając z technologii zbudowanej od podstaw ✅ Operatorzy CODEC ​ Operatorzy to autonomiczne agenty oprogramowania, które mogą wykonywać zadania w cyklu percepcja-rozumowanie-działanie. Zdolność do widzenia ekranu (lub strumieni kamer lub danych z czujników) pozwala im podejmować decyzje, których LLM nie byłby w stanie podjąć ​ • Percepcja: Zbiera zrzuty ekranu, strumienie kamer lub dane z czujników • Rozumowanie: Przetwarza obserwacje i instrukcje za pomocą modeli wizji-języka • Działanie: Wykonuje decyzje poprzez interakcje z UI lub kontrolę sprzętu ​ W ciągłej pętli Operatorzy mogą działać na serwerach bare-metal, maszynach wirtualnych (na dowolnym systemie operacyjnym) lub nawet na robotach. ​ Każdy operator automatycznie otrzymuje dedykowaną maszynę obliczeniową (izolowaną maszynę wirtualną lub instancję kontenera) i może być zabezpieczony przez TEE (izolacja na poziomie sprzętu) dla wrażliwego kodu i danych. ​ ✅ Warstwa Inteligencji AI ​ Operatorzy mogą być skonfigurowani do używania jednego lub więcej modeli (LLM lub VLA) połączonych jako ich "mózg" ​ Na przykład, połączenie niskokosztowego modelu językowego Mixtral-8×7B z modelem wizji open-source CogVLM pozwala operatorom odczytywać tekst na ekranie i interpretować na żywo strumienie ekranu lub kamery - wszystko to za ułamek kosztów GPT-4. ​ Model VLA (Wizja-Język-Działanie) pozwala agentowi interpretować dane wizualne, a następnie podejmować decyzję na podstawie tego, co widzi ✅ Przykłady użycia ​ 🔹 Automatyzacja biurowa ​ Może automatyzować powtarzalne zadania biurowe, kontrolując GUI. Na przykład wypełnianie arkuszy kalkulacyjnych, aktualizowanie kalendarzy lub inne zadania wymagające interakcji z GUI ​ Może obsługiwać aktualizacje UI, ponieważ faktycznie widzi, co robi ​ 🔹 Agenci gier ​ Operatorzy mogą kontrolować graczy lub testować gry wideo. Agenci przesyłają strumieniowo ekran i mogą podejmować działania na podstawie tego, co widzą, wysyłając polecenia klawiatury lub myszy do gry. ​ Mogą być używani do testowania QA, a nawet jako zaawansowani przeciwnicy NPC lub automatyzacja gier web3 ​ 🔹 Robotyka ​ Operatorzy mogą kontrolować fizyczne roboty. Warstwa maszyny połączy się z hardwarem robotów z czujnikami i aktuatorami, a agent może wysyłać polecenia do poruszania ramieniem lub nawigacji. ​ Np. może uchwycić strumień kamery obiektów poruszających się na taśmie transportowej i podejmować działania na podstawie ruchu. Jeśli na drodze znajduje się przeszkoda, Operator może ją zobaczyć i kontrolować robota, aby jej uniknąć ​ ✅ Zbieranie danych i bezpieczeństwo on-chain ​ Przenosząc informacje operatorów na blockchain Solana, mogą oferować niezmienne dzienniki działań ze wszystkich wykonanych działań ​ W przyszłości możemy zobaczyć moment, w którym firmy robotyczne będą zobowiązane do stakowania tokena, aby zagwarantować, że ich operatorzy nie spowodują fizycznego kontaktu robota z człowiekiem przy użyciu siły powyżej określonej wartości. Jeśli to naruszą, zostaną ukarani częścią stakowanego tokena (jak EigenLayer / Symbiotic restaking) ​ ✅ Środowisko szkoleniowe dla robotyki ​ Z Codec, nieprzeszkolone modele wirtualne mogą być wdrażane w dynamicznym, wysokiej wierności środowisku szkoleniowym, bez potrzeby fizycznego robota. ​ Symuluj, trenuj i udoskonalaj złożone zachowania na skalę chmurową, a następnie z pewnością przenieś te polityki na rzeczywisty sprzęt. Środowiska szkoleniowe mogą być szybko uruchamiane dla wszystkich typów operatorów (oprogramowanie, gry lub robotyka) ​ ✅ SDK Codec ​ Zostało opracowane pełne SDK i API, aby deweloperzy mogli łatwo wdrażać swoich operatorów ​ ✅ Rynek operatorów ​ Operatorzy mogą (w przyszłości) być sprzedawani na niestandardowym rynku. ​ Będzie podział przychodów, abyś mógł wysyłać i monetyzować swojego operatora VLA, co oznacza, że jeśli wyszkolisz skutecznych operatorów, możesz mieć dodatkowe źródła przychodów ​ ✅ Podsumowując ​ Myślę, że w przyszłym roku zobaczymy ogromny rozwój w dziedzinie VLA. Widzieliśmy, jak szybko rozwijają się LLM, to było tylko kilka lat temu, gdy uruchomiono GPT-1. Robotyka i modele wizji prawdopodobnie staną się gorącą narracją w pewnym momencie tego cyklu, a ja lubię być wczesnym inwestorem ​ Och, i czy wspomniałem, że współzałożyciel pochodzi z Hugging Face i Elixir games 👀 ​ Uwaga: Slappjakke ma duże torby $CODEC, a to jest jeden z tych momentów, kiedy stałem się jeszcze bardziej optymistyczny, pisząc ten wątek i dodałem jeszcze więcej ​ Jak zawsze, to nie jest porada finansowa i jest to inwestycja wysokiego ryzyka, więc przeprowadź własne badania.
Pokaż oryginał
8,97 tys.
105
Treści na tej stronie są dostarczane przez strony trzecie. O ile nie zaznaczono inaczej, OKX nie jest autorem cytowanych artykułów i nie rości sobie żadnych praw autorskich do tych materiałów. Treść jest dostarczana wyłącznie w celach informacyjnych i nie reprezentuje poglądów OKX. Nie mają one na celu jakiejkolwiek rekomendacji i nie powinny być traktowane jako porada inwestycyjna lub zachęta do zakupu lub sprzedaży aktywów cyfrowych. Treści, w zakresie w jakim jest wykorzystywana generatywna sztuczna inteligencja do dostarczania podsumowań lub innych informacji, mogą być niedokładne lub niespójne. Przeczytaj podlinkowany artykuł, aby uzyskać więcej szczegółów i informacji. OKX nie ponosi odpowiedzialności za treści hostowane na stronach osób trzecich. Posiadanie aktywów cyfrowych, w tym stablecoinów i NFT, wiąże się z wysokim stopniem ryzyka i może podlegać znacznym wahaniom. Musisz dokładnie rozważyć, czy handel lub posiadanie aktywów cyfrowych jest dla Ciebie odpowiednie w świetle Twojej sytuacji finansowej.