Aktualizacje AI: Rakieta Auto-GPT, tanie dzieci LLaMA i nie tylko

May 09 2023

Ta fala AI nie zbliża się do szczytu

Witamy ponownie w aktualizacjach AI, w których omawiamy najnowsze osiągnięcia w najgorętszej dziedzinie technologii. Od ostatniej części minął ponad miesiąc, a tyle się wydarzyło.

Lamy nie da się powstrzymać! Wykonane w DreamStudio.

Witamy ponownie w aktualizacjach AI, w których omawiamy najnowsze osiągnięcia w najgorętszej dziedzinie technologii. Od ostatniej części minął ponad miesiąc, a tyle się wydarzyło. Czytam codziennie i nadal nie czuję się wciągnięty! Zanurzmy się, przytulmy kilka lam i dowiedzmy się, co społeczność sztucznej inteligencji ma dla nas dzisiaj w zanadrzu.

Jak zwykle w tym artykule wspomniano o firmie Microsoft, moim pracodawcy. Ten artykuł napisałem w wolnym czasie i wszystkie opinie są moimi własnymi.

Nowy w AI? Mam cię w zasięgu ręki! Zacznij tutaj:

Poznajmy sztuczną inteligencję

Agenci AI i Auto-GPT

ChatGPT odczytuje Twoje wiadomości i zapisuje odpowiedzi bez dostępu do Internetu. Nowy Bing robi to samo, ale najpierw szuka odpowiedzi w Internecie. Ale co by było, gdybyśmy poprosili sztuczną inteligencję o więcej? Co by było, gdybyśmy chcieli czegoś złożonego, czegoś, czego nie dałoby się zrobić w jednym monicie?

Wejdź do agentów AI: produkty AI, które zapewniają modelom takim jak ChatGPT dostęp do narzędzi, takich jak wyszukiwanie w Internecie, przechowywanie dokumentów i silniki obliczeniowe, takie jak WolframAlpha . Po wyświetleniu monitu agenci wyznaczają cel i planują serię zadań, aby osiągnąć ten cel. Agenci „rozmawiają ze sobą” podczas pracy, analizując złożony proces i używając swoich narzędzi, aby robić postępy. Sztuczna agencja tego rodzaju była wyobrażana od wieków , ale nie była wykonalna aż do ChatGPT.

Na przykład agent poproszony o „ znalezienie pierwiastka kwadratowego wieku założyciela IBM ” może najpierw użyć wyszukiwania, aby zidentyfikować założyciela IBM, wyszukać ponownie, aby znaleźć jego datę urodzenia, użyć narzędzia daty, aby poznać aktualną datę , użyj narzędzia matematycznego, aby uzyskać ostateczną odpowiedź, a następnie zsyntetyzuj te informacje w odpowiedź podobną do ChatGPT. Wszystko to z jednego monitu.

30 marca Toran Bruce Richards opublikował Auto-GPT , agenta AI opartego na GPT-4. Każdy może z niego korzystać bez wysyłania jakichkolwiek danych do Richardsa — to znaczy, o ile jest gotów zapłacić OpenAI kilka groszy za tysiąc słów wysłanych do iz GPT-4. Projekt szybko osiągnął pozycję 30. najczęściej odwiedzanego repozytorium na GitHub .

Obecnie istnieje wielu innych agentów AI, w tym BabyAGI , oparty na przeglądarce AgentGPT i Khan Academy Khanmigo (który zaciera granicę między agencją a uziemieniem AI ). Spodziewaj się, że wkrótce pojawi się więcej produktów, które (dyskretnie?) wykorzystują sztuczną inteligencję.

Historia gwiazd Auto-GPT w porównaniu z 1., 10. i 20. najczęściej odwiedzanymi repozytoriami GitHub według stanu na 6 maja.

Sztuczna inteligencja + przyjaźń = przytulanieGPT, czyli Microsoft JARVIS

Aby zapoznać się z naukowym studium przypadku dotyczącym mocy i różnorodnych zastosowań agentów AI, nie szukaj dalej niż artykuł HuggingGPT , opublikowany przez Microsoft Research Asia i Zhejiang University 30 marca. Badają w nim agenta obsługiwanego przez ChatGPT z dostępem do wyspecjalizowane modele uczenia maszynowego z popularnego rejestru Hugging Face.

Hugging Face to wiodąca platforma do udostępniania modeli uczenia maszynowego, w tym narzędzi do etykietowania obrazów, generatorów wideo, klasyfikatorów tekstu, narzędzi do rozumienia dźwięku i nie tylko. Wiele modeli, w przeciwieństwie do ChatGPT, jest wysoce wyspecjalizowanych i działa tylko na dobrze ustrukturyzowanych danych (zamiast zwykłego języka angielskiego), więc są tańsze w eksploatacji i dają lepsze wyniki. Ponieważ HuggingGPT (znany również jako JARVIS/Jarvis ) ma dostęp do dowolnego modelu na Hugging Face, może bezproblemowo współpracować z obrazami, dźwiękiem, tekstem, wideo i innymi formatami plików.

Na poniższym rysunku z artykułu widzimy wyjaśnienie Jarvisa, w jaki sposób wygenerował dubbingowany film z samego monitu tekstowego.

Bippity boppity boo, Jarvis ma dla ciebie fałszywy film! Zaadaptowano z rysunku 4 w artykule HuggingGPT. Zobacz także transkrypcję obrazu dla wszystkich Twoich potrzeb związanych z kopiowaniem i wklejaniem oraz użytecznością. ‍

PośpiechGPT

Do tej pory daliśmy AI dostęp do Internetu i przyjaciół z Hugging Face. Ale co by było, gdybyśmy dali mu najpotężniejszy zasób ze wszystkich?

15 marca projektant Jackson Greenhouse Fall dał GPT-4 nędzne 100 dolarów i poprosił o zbudowanie własnego biznesu. Twierdzi, że wydał pieniądze zgodnie z poleceniem swojego szefa GPT i stał się wirusowy w tym procesie. Biznes, niszowy blog eko-żyjący o nazwie Green Gadget Guru , nie rozkwitł, ponieważ od tego czasu Fall nadał priorytet Makeshift , 3000-osobowej społeczności Discord, którą założył kilka dni po tym, jak zyskał sławę w Internecie. Grupa spin-off używająca nazwy HustleGPT na Twitterze i Discordzie niedawno przekroczyła 6000 członków Discord. ( Zakazali także upadku .) Jak powiedział Yogi Berra, „trudno jest prognozować, zwłaszcza na przyszłość”, ale bariera dla rozpoczęcia działalności gospodarczej została z pewnością znacznie obniżona dzięki najnowszym narzędziom sztucznej inteligencji.

Wiele dzieci LLaMA

Ostatnim razem w AI Updates pisaliśmy o ogłoszeniu LLaMA Meta , modelu językowego udostępnionego naukowcom (który wyciekł 3 marca ). Od tego czasu ludzie zbudowali bardziej wyspecjalizowane modele oparte na LLaMA, osiągając wydajność zbliżoną do ChatGPT w badaniach preferencji użytkowników. Dzieci LLaMA to GPT4All , darmowy klon ChatGPT do pobrania, który działa bez Internetu, oraz Stanford's Alpaca , model podążający za instrukcjami, którego wersja demonstracyjna została zamknięta cztery dni po ogłoszeniu 13 marca ze względów bezpieczeństwa. Każdy model został wykonany za mniej niż 1500 USD i być może za osobo-miesiąc pracy (GPT4All zostało wykonane przez 5 autorów, którzy pracowali „ około czterech dni”). Naturalną wadą są odpowiedzi o niższej jakości, ale nie potrzebujemy Ferrari, żeby dostać się do sklepu spożywczego, prawda? (Dziękuję Patrice'owi Pellandowi, mojemu menedżerowi ds. potrójnego pomijania, za podzielenie się tą analogią.)

Istnieje teraz niezliczona ilość innych projektów opartych na LLaMA, w tym ChatLLaMA (do szkolenia własnego modelu opartego na LLaMA), interaktywna Vicuna (wyszkolona za 300 USD) i Berkeley's Koala (wyszkolona za mniej niż 100 USD!). Ponieważ koszty szkolenia modeli wciąż spadają, spodziewaj się, że coraz więcej małych LLaMA będzie pojawiać się na Twojej stronie internetowej!

Obawy związane z antropomorfizmem AI

Udawanie, że wszystkie te programy to zwierzęta, to zabawa i gry, prawda? Cóż, niektórzy badacze nie zgadzają się, a antropomorfizm sztucznej inteligencji (czyli przypisywanie jej cech ludzkich) jest poważnym problemem w niektórych kręgach ekspertów.

Poniżej znajduje się zbiór dobrze cytowanych rozmów zapoczątkowanych przez Bena Shneidermana i opublikowanych przez Chenhao Tan . To wciągająca akademicka debata na temat reakcji na produkt sztucznej inteligencji, który w przekonujący sposób określa się jako „ja”, naszej tendencji do przywiązywania się do przedmiotów innych niż ludzie oraz potencjalnego wpływu takich technologii, które stają się wszechobecne. Odświeżający jest widok szczerej dyskusji na temat niebezpieczeństw związanych z tymi nowymi narzędziami.

O antropomorfizmie AI

I to już koniec tej edycji! Społeczność sztucznej inteligencji znalazła się w tym miesiącu w centrum uwagi, oferując nam do wypróbowania miliardy nowych modeli, narzędzi i produktów! Badacze Big Tech nadal badają potencjał już istniejących modeli, a bariery wejścia na pole zostały obniżone. Obawy pozostają i zawsze będą, ale możemy się kształcić, słuchając rozmów ekspertów i dzieląc się naszymi przemyśleniami.