Eu testei o novo modelo OpenAI GPT-3 Davinci

Nov 30 2022
OpenAI anunciou o lançamento de um novo modelo GPT-3 chamado 'text-davinci-003' e há melhorias notáveis ​​de uma perspectiva generativa. Abaixo, faço uma comparação lado a lado dos modelos Davinci 1, 2 e a última adição, Davinci 3.

OpenAI anunciou o lançamento de um novo modelo GPT-3 chamado 'text-davinci-003' e há melhorias notáveis ​​de uma perspectiva generativa.

Abaixo, faço uma comparação lado a lado dos modelos Davinci 1, 2 e a última adição, Davinci 3.

Em primeiro lugar , a Prompt Engineering como uma habilidade evoluirá à medida que novos modelos forem introduzidos, juntamente com as configurações do modelo.

Em segundo lugar , as respostas geradas são muito diferentes em cada solicitação de geração, mesmo que o prompt, o modelo e as configurações projetadas permaneçam os mesmos.

Portanto, embora todas as respostas sejam relevantes e precisas, para certos tipos de implementação, uma resposta mais constante pode ser necessária.

Em terceiro lugar , o nível de detalhe que a resposta gerada contém e como os pontos sequenciais são criados são realmente surpreendentes, com cada ponto se baseando no anterior.

As respostas em geral são muito mais longas, o nível de coerência e fluência é o que nos acostumamos com o OpenAI.

Mais sobre isso depois…

Fonte Os modelos GPT-3 compreendem e geram linguagem natural. Estes são os quatro principais modelos com diferentes níveis de potência para diferentes tarefas pretendidas. Davinci é o modelo mais capaz, Ada é o mais rápido.

O novo modelo text-davinci-003 da OpenAI melhorou o desempenho nos seguintes aspectos:

▪️ Escrita de maior qualidade com conteúdo mais claro, envolvente e atraente .

▪️Trata instruções mais complexas, o que permite mais criatividade na engenharia de prompts .

▪️ Crie conteúdo de formato longo por meio de tarefas de geração e desbloqueio que seriam impossíveis anteriormente.

⭐️ Siga-me no LinkedIn para obter o melhor conteúdo de IA conversacional ⭐️

Realizei uma comparação direta entre os três modelos Davinci, denominados:

1️⃣ texto-davinci-001
2️⃣ texto-davinci-002
3️⃣ texto-davinci-003

Para todos os três modelos, usei o aspecto generativo do modelo, com este prompt de engenharia :

I want to create an intelligent chatbot people can get weather information from. How do I create such a chatbot?

Abaixo, você vê o conteúdo gerado a partir do modelo text-davinci-001 :

E aqui ( abaixo ) está o conteúdo gerado a partir do modelo text-davinci-002 mais recente:

E por último, abaixo estão dois exemplos do novo modelo text-davinci-003 :

Ao gerar ou executar novamente a consulta, os resultados podem diferir um pouco. Considere também as tecnologias listadas abaixo, que achei interessantes:

Conclusão

A partir dos resultados acima, é evidente que o novo modelo Davinci produz uma escrita de qualidade muito maior com saída mais longa. E somado a essas melhorias, o estilo de escrita é instrutivo, com pontos acionáveis ​​e sequenciados.

Obviamente, o custo será levado em consideração e, em um ambiente de produção, as tarefas pretendidas e os resultados esperados precisarão ser comparados ao custo versus desempenho de outros modelos.

⭐️ Siga-me no LinkedIn para obter o melhor conteúdo de IA conversacional ⭐️

Atualmente sou o Evangelista Chefe @ HumanFirst . Eu exploro e escrevo sobre todas as coisas na interseção de IA e linguagem; variando de LLMs , Chatbots , Voicebots , estruturas de desenvolvimento, espaços latentes centrados em dados e muito mais.

https://www.linkedin.com/in/cobusgreyling
O Cobus Quadrant™ de design de NLU O Cobus Quadrant™ de recursos de design de conversação
Implementando IA centrada em dados para modelos NLU Resolvendo a cauda longa da distribuição de intenção