Atualizações de IA: o foguete Auto-GPT, os filhos baratos do LLaMA e muito mais

May 09 2023

Esta onda de IA está longe de atingir o pico

As lhamas não vão parar! Feito com DreamStudio.

Olá e bem-vindo de volta ao AI Updates, onde cobrimos os últimos desenvolvimentos no espaço mais quente da tecnologia. Já se passou mais de um mês desde a última parcela, e tanta coisa aconteceu. Tenho lido todos os dias e ainda não me sinto apanhado! Vamos mergulhar, abraçar algumas lhamas e aprender o que a comunidade de IA tem reservado para nós hoje.

Como sempre, este artigo menciona a Microsoft, meu empregador. Escrevi este artigo em meu tempo livre e todas as opiniões são minhas.

Novo na IA? Eu tenho você coberto! Começa aqui:

Vamos aprender sobre inteligência artificial

Agentes AI e Auto-GPT

ChatGPT lê suas mensagens e escreve respostas sem qualquer acesso à Internet. O novo Bing faz o mesmo, mas primeiro procura uma resposta online. Mas e se pedíssemos à IA para fazer mais? E se quiséssemos algo complexo, algo que não pudesse ser feito em um único prompt?

Entre os agentes de IA: produtos de IA que fornecem a modelos como ChatGPT acesso a ferramentas como pesquisa na Internet, armazenamento de documentos e mecanismos computacionais como o WolframAlpha . Quando solicitado, os agentes definem uma meta e planejam uma série de tarefas para atingir essa meta. Os agentes “falam consigo mesmos” à medida que avançam, raciocinando sobre um processo complexo e usando suas ferramentas para progredir. Agências artificiais desse tipo foram imaginadas por séculos , mas não eram viáveis até o ChatGPT.

Por exemplo, um agente solicitado a “ encontrar a raiz quadrada da idade do fundador da IBM ” pode primeiro usar uma pesquisa para identificar o fundador da IBM, pesquisar novamente para encontrar sua data de nascimento, usar uma ferramenta de data para saber a data atual , use uma ferramenta matemática para obter uma resposta final e sintetize essas informações em uma resposta semelhante ao ChatGPT. Tudo isso a partir de um único prompt.

Em 30 de março, Toran Bruce Richards publicou o Auto-GPT , um agente de IA alimentado por GPT-4. Qualquer pessoa pode usá-lo sem enviar nenhum dado para Richards - isto é, desde que esteja disposto a pagar à OpenAI alguns centavos por mil palavras enviadas de e para GPT-4. O projeto disparou para se tornar o 30º repositório mais estrelado no GitHub .

Muitos outros agentes de IA já existem, incluindo BabyAGI , AgentGPT baseado em navegador e Khanmigo da Khan Academy (que confunde a linha entre agência e base de IA ). Espere mais produtos que (discretamente?) Use agência AI para ser anunciado em breve.

Histórico de estrelas do GPT automático contra o 1º, 10º e 20º repositórios do GitHub com mais estrelas em 6 de maio.

AI + amizade = HuggingGPT, também conhecido como Microsoft JARVIS

Para um estudo de caso de nível de pesquisa sobre o poder e diversas aplicações de agentes de IA, não procure além do artigo HuggingGPT , publicado pela Microsoft Research Asia e pela Universidade de Zhejiang em 30 de março. modelos especializados de aprendizado de máquina do popular registro Hugging Face.

Hugging Face é a plataforma líder para compartilhar modelos de aprendizado de máquina, incluindo rotuladores de imagem, geradores de vídeo, classificadores de texto, entendedores de áudio e muito mais. Muitos modelos, ao contrário do ChatGPT, são altamente especializados e funcionam apenas com dados bem estruturados (em vez de inglês simples), por isso são mais baratos de executar e oferecem melhores resultados. Como o HuggingGPT (também conhecido como JARVIS/Jarvis ) tem acesso a qualquer modelo no Hugging Face, ele pode funcionar perfeitamente com imagens, áudio, texto, vídeo e outros formatos de arquivo.

Na figura abaixo do papel, vemos a explicação de Jarvis de como ele gerou um vídeo dublado a partir de nada além de um prompt de texto.

Bippity boppity boo, Jarvis tem um vídeo falso para você! Adaptado da Figura 4 do artigo HuggingGPT. Veja também a transcrição da imagem para todas as suas necessidades de copiar e colar e usabilidade. ‍

HustleGPT

Até agora, demos acesso de IA à Internet e aos amigos do Hugging Face. Mas e se dermos a ele o recurso mais poderoso de todos?

Em 15 de março, o designer Jackson Greenhouse Fall deu ao GPT-4 míseros US$ 100 e pediu que ele abrisse seu próprio negócio. Ele afirma ter gasto o dinheiro como seu chefe GPT o instruiu, e ele se tornou viral no processo. O negócio, um nicho de blog de vida ecológica chamado Green Gadget Guru , não floresceu, já que Fall desde então priorizou o Makeshift , a comunidade Discord de 3.000 membros que ele iniciou dias depois de encontrar a fama na Internet. Um grupo derivado usando o nome HustleGPT no Twitter e no Discord recentemente ultrapassou 6.000 membros do Discord. ( Eles também proibiram o outono .) Como Yogi Berra disse, “é difícil fazer previsões, especialmente sobre o futuro”, mas a barreira para iniciar um negócio certamente foi bastante reduzida pelas mais novas ferramentas de IA.

Os muitos filhos de LLaMA

Da última vez em AI Updates , cobrimos o anúncio do Meta's LLaMA , um modelo de linguagem lançado para pesquisadores (e vazado em 3 de março ). Desde então, as pessoas construíram modelos mais especializados baseados em LLaMA, alcançando desempenho próximo ao ChatGPT em estudos de preferência do usuário. Os filhos do LLaMA incluem o GPT4All , um clone do ChatGPT para download gratuito que roda sem Internet, e o Alpaca de Stanford , um modelo de acompanhamento de instruções cuja demonstração foi encerrada quatro dias após seu anúncio em 13 de março devido a questões de segurança. Cada modelo foi feito por menos de $ 1.500 e talvez uma pessoa-mês de trabalho (GPT4All foi feito por 5 autores que trabalharam “ cerca de quatro dias”). A desvantagem natural aqui são as respostas de baixa qualidade, mas não precisamos de uma Ferrari para chegar ao supermercado, precisamos? (Agradeço a Patrice Pelland, meu gerente de nível triplo, por compartilhar essa analogia.)

Existem agora inúmeros outros projetos baseados em LLaMA por aí, incluindo ChatLLaMA (para treinar seu próprio modelo baseado em LLaMA), o Vicuna interativo (treinado por US$ 300) e Berkeley's Koala (treinado por menos de US$ 100!). Como os custos para treinar modelos continuam diminuindo, espere ver mais e mais pequenos LLaMAs chegando a um site perto de você!

Preocupações com o antropomorfismo da IA

Fingir que todos esses programas são animais é divertido e divertido, certo? Bem, alguns pesquisadores discordam, e o antropomorfismo da IA (ou seja, atribuir qualidades humanas à IA) é uma preocupação significativa em alguns círculos de especialistas.

Abaixo está uma coleção de conversas bem citadas iniciadas por Ben Shneiderman e publicadas por Chenhao Tan . É um debate acadêmico envolvente sobre as reações a um produto de IA que se refere de forma convincente a si mesmo como “eu”, nossa tendência de nos apegarmos a objetos não humanos e o impacto potencial de tais tecnologias se tornarem onipresentes. É revigorante ver um discurso honesto sobre os perigos dessas novas ferramentas.

Sobre o antropomorfismo da IA

E isso é um embrulho para esta edição! A comunidade de IA está no centro do palco este mês com bilhões de novos modelos, ferramentas e produtos para experimentarmos! Os pesquisadores da Big Tech continuam explorando o potencial dos modelos já existentes, e as barreiras para entrar no campo foram reduzidas. As preocupações permanecem, e sempre existirão, mas podemos nos educar ouvindo conversas de especialistas e compartilhando nossos pensamentos.