Coletando referências úteis de LLM (Large Language Model)

May 02 2023
Estou aprendendo mais sobre LLMs e decidi registrar referências úteis à medida que avança. Eu apreciaria qualquer sugestão adicional.

Estou aprendendo mais sobre LLMs e decidi registrar referências úteis à medida que avança. Eu apreciaria qualquer sugestão adicional.

No momento, estou abordando isso como diferentes camadas:

  1. Engenharia imediata. A perspectiva do usuário avançado.
  2. Treinando/ajustando seus próprios LLMs. A perspectiva do desenvolvedor de aplicativos.
  3. Como funcionam os LLMs. Compreender como funciona a tecnologia subjacente.
  4. Estratégia/tópicos mais amplos.
  • Engenharia de prompt do ChatGPT para desenvolvedores por DeepLearning.AI
  • Introdução à engenharia de prompt da Microsoft
  • Técnicas de engenharia de prompt da Microsoft
  • Aprender a Solicitar
  • Prompt Engineering no ChatGPT: um curso de mestrado abrangente do The Prompt Artisan
  • SudoLang . “SudoLang é uma pseudolinguagem projetada para interagir com LLMs. Ele fornece uma interface amigável que combina expressões de linguagem natural com construções de programação simples, tornando-o fácil de usar para programadores novatos e experientes.”
  • Modelos de linguagem grandes de ajuste fino com rosto de abraço e velocidade profunda por Sean Owen em Databricks
  • Ajuste fino de LLMs de 20B com RLHF em uma GPU de consumidor de 24GB por Hugging Face
  • xturação por IA estocástica. xturingfornece um ajuste fino rápido, eficiente e simples de LLMs, como LLaMA, GPT-J, Galactica e muito mais.”
  • Como o ChatGPT Funciona Tecnicamente | Vídeo da Arquitetura ChatGPT por ByteByteGo
  • Oito coisas a saber sobre modelos de linguagem grandes por Samuel R. Bowman
  • The Practical Guides for Large Language Models “Uma lista com curadoria (ainda ativamente atualizada) de recursos de guia prático de LLMs.”
  • Transformers from Scratch de Brandon Rohrer