Recopilación de referencias útiles de LLM (Large Language Model)
May 02 2023
Estoy aprendiendo más sobre los LLM y pensé en registrar referencias útiles a medida que avanzo. Agradecería cualquier sugerencia adicional.
Estoy aprendiendo más sobre los LLM y pensé en registrar referencias útiles a medida que avanzo. Agradecería cualquier sugerencia adicional.
Por el momento, me estoy acercando a esto como diferentes capas:
- Ingeniería inmediata. La perspectiva del usuario avanzado.
- Capacitación / ajuste de sus propios LLM. La perspectiva del desarrollador de aplicaciones.
- Cómo funcionan los LLM. Comprender cómo funciona la tecnología subyacente.
- Estrategia/temas más amplios.
- ChatGPT Prompt Ingeniería para desarrolladores por DeepLearning.AI
- Introducción a la ingeniería rápida de Microsoft
- Técnicas de ingeniería rápidas de Microsoft
- Aprender indicaciones
- Ingeniería rápida en ChatGPT: un curso de maestría integral de The Prompt Artisan
- SudoLang . “SudoLang es un pseudolenguaje diseñado para interactuar con LLM. Proporciona una interfaz fácil de usar que combina expresiones de lenguaje natural con construcciones de programación simples, lo que facilita su uso tanto para programadores novatos como experimentados”.
- Ajuste fino de modelos de lenguaje grande con Hugging Face y DeepSpeed por Sean Owen en Databricks
- Ajuste fino de LLM 20B con RLHF en una GPU de consumo de 24 GB mediante Hugging Face
- xturing por IA estocástica. “
xturing
proporciona un ajuste fino rápido, eficiente y simple de LLM, como LLaMA, GPT-J, Galactica y más”.
- Cómo funciona técnicamente ChatGPT | Vídeo de arquitectura ChatGPT de ByteByteGo
- Ocho cosas que debe saber sobre modelos de lenguaje grande por Samuel R. Bowman
- The Practical Guides for Large Language Models "Una lista seleccionada (todavía actualizada activamente) de recursos de guías prácticas de LLM".
- Transformadores desde cero de Brandon Rohrer