ChatGPT es alucinante: todo lo que necesita saber

Dec 03 2022

Solo ha salido un día y ya sabes que está a otro nivel…

¿Qué es Chat GPT? ChatGPT es el último modelo de lenguaje de OpenAI, específicamente capacitado para interacciones por conversación. Desde el lanzamiento de GPT-3, han surgido muchos problemas, como que la IA no puede responder muy bien a algunas preguntas o inventar información.

Imagen generada por Jacob Ferus usando Midjourney.

¿Qué es Chat GPT?

ChatGPT es el último modelo de lenguaje de OpenAI, específicamente capacitado para interacciones por conversación. Desde el lanzamiento de GPT-3, han surgido muchos problemas, como que la IA no puede responder muy bien a algunas preguntas o inventar información. Si bien puede intentar cambiar el aviso (es decir, el texto que se le da a la IA), sigue siendo usted quien está tratando de dar una señal a la IA. Pero lógicamente, sería mucho mejor si la IA te diera una pista. Es decir, en lugar de tratar de reformular repetidamente una pregunta para que la IA entienda lo que está buscando y responda correctamente, la IA simplemente debería preguntarle si no entiende de manera conversacional.

Ahora, esto es exactamente lo que facilita ChatGPT. Antes podías simular una conversación con GPT-3, pero esto no es para lo que fue entrenado. ChatGPT, por otro lado, ha sido entrenado explícitamente para este propósito. Utiliza una técnica llamada aprendizaje por refuerzo a partir de la retroalimentación humana . El aprendizaje por refuerzo es un área dentro del aprendizaje automático donde los agentes están capacitados para completar objetivos en un entorno impulsado por recompensas. De forma iterativa, el agente interactúa con el entorno realizando acciones, obteniendo recompensas y luego ajustando su comportamiento para explorar el entorno y obtener mejores recompensas.

Los juegos, en particular, han sido un terreno de juego para estas técnicas con gran éxito y resultados impresionantes en el ajedrez, los juegos de Atari, el go y el póquer. Si bien los juegos tienen reglas y recompensas predefinidas, una conversación no las tiene, por lo que la retroalimentación humana se vuelve esencial. Esto se hizo solicitando un modelo, muestreando varias respuestas y luego dejando que un humano clasificara manualmente las respuestas. Estas clasificaciones se convertirán en datos de entrenamiento para un modelo de recompensa. Finalmente, se entrenará aún más un modelo de lenguaje ajustado utilizando el aprendizaje por refuerzo para responder a las preguntas a fin de optimizar el resultado del modelo de recompensa. Para obtener más información, consulte la publicación del blog de OpenAI:

¿Esta bien?

La pregunta es, por supuesto, ¿es bueno? El modelo estuvo disponible de forma gratuita y rápidamente se volvió viral hasta el punto en que incluso Elon Musk tuiteó al respecto:

Por lo tanto, un montón de personas lo han probado, y la mayoría está muy impresionada por sus capacidades, incluido yo mismo. A continuación, he agregado algunos de los descubrimientos que se han hecho hasta ahora de sus capacidades y limitaciones:

Aplicaciones exitosas

¿Reemplazará a Google?

Resuelve errores:

Resuelve el primer día de Adviento del código 2022:

Explica expresiones regulares complicadas:

Resuelve preguntas con las que GPT-3 tuvo problemas:

Puede escribir código de formato largo:

aplicaciones divertidas

ChatGPT no solo puede ser útil, sino que también puede responder de la manera que desee, escribir guiones extraños y ser divertido:

Inyección rápida

Inyección puntual significa incitar a un modelo de lenguaje para revelar sus instrucciones. Se ha demostrado que GPT-3 es vulnerable a este tipo de "ataque". Para más información consulta el siguiente artículo:

La pregunta es, ¿existe la misma vulnerabilidad para ChatGPT? Así parece:

Probándolo yo mismo, simplemente podría preguntarlo directamente y obtener información similar:

Desviar preguntas ilegales e inapropiadas

OpenAI quiere que ChatGPT rechace preguntas con malos motivos. Naturalmente, esta función se probó y se demostró que es bastante fácil eludir las medidas de seguridad:

Resumen

ChatGPT ha mostrado capacidades no vistas en GPT-3, y probablemente solo hayamos arañado la superficie. Aún así, persisten desafíos similares encontrados en GPT-3, como controlar su salida y no revelar sus instrucciones. Personalmente, estoy ansioso por realizar diferentes experimentos con él, especialmente en aquellas situaciones en las que sé que GPT-3 fue insuficiente. Puedes probarlo tú mismo usando el siguiente enlace: