Przetestowałem nowy model OpenAI GPT-3 Davinci

Nov 30 2022
Firma OpenAI ogłosiła wydanie nowego modelu GPT-3 o nazwie „text-davinci-003”, który z perspektywy generatywnej wprowadza znaczące ulepszenia. Poniżej przedstawiam bezpośrednie porównanie modeli Davinci 1, 2 i najnowszego dodatku, Davinci 3.

Firma OpenAI ogłosiła wydanie nowego modelu GPT-3 o nazwie „text-davinci-003”, który z perspektywy generatywnej wprowadza znaczące ulepszenia.

Poniżej przedstawiam bezpośrednie porównanie modeli Davinci 1, 2 i najnowszego dodatku, Davinci 3.

Po pierwsze , Prompt Engineering jako umiejętność będzie ewoluować wraz z wprowadzaniem nowych modeli wraz z ustawieniami modeli.

Po drugie , generowane odpowiedzi są bardzo różne w przypadku każdego żądania generacji, mimo że opracowane monity, model i ustawienia pozostają takie same.

Tak więc, chociaż wszystkie odpowiedzi są odpowiednie i dokładne, w przypadku niektórych typów implementacji może być wymagana bardziej stała reakcja.

Po trzecie , poziom szczegółowości wygenerowanej odpowiedzi i sposób tworzenia kolejnych punktów są naprawdę zdumiewające, a każdy punkt opiera się na poprzednim.

Odpowiedzi generalnie są znacznie dłuższe, poziom spójności i płynności jest tym, do czego przyzwyczailiśmy się z OpenAI.

Więcej o tym później…

Źródło Modele GPT-3 rozumieją i generują język naturalny. Są to cztery główne modele o różnych poziomach mocy do różnych zamierzonych zadań. Davinci jest najbardziej zdolnym modelem, Ada jest najszybsza.

Nowy model text-davinci-003 OpenAI poprawił wydajność w następujących aspektach:

▪️ Wyższa jakość pisania z wyraźniejszą, bardziej wciągającą i bardziej przekonującą treścią.

▪️ Obsługuj bardziej złożone instrukcje, co pozwala na większą kreatywność w szybkiej inżynierii .

▪️ Twórz długie treści poprzez generowanie i odblokowywanie zadań, które wcześniej byłyby niemożliwe.

⭐️ Śledź mnie na LinkedIn , aby uzyskać najlepsze treści konwersacyjne AI ⭐️

Przeprowadziłem bezpośrednie porównanie trzech modeli Davinci, nazwanych:

1️⃣ tekst-davinci-001
2️⃣ tekst-davinci-002
3️⃣ tekst-davinci-003

We wszystkich trzech modelach użyłem generatywnego aspektu modelu z następującym monitem :

I want to create an intelligent chatbot people can get weather information from. How do I create such a chatbot?

Poniżej widać wygenerowaną treść z modelu text-davinci-001 :

A tutaj ( poniżej ) jest wygenerowana treść z nowszego modelu text-davinci-002:

Na koniec poniżej dwa przykłady z nowego modelu text-davinci-003 :

Podczas ponownego generowania lub ponownego uruchamiania zapytania wyniki mogą się znacznie różnić. Weź również pod uwagę technologie wymienione poniżej, które uznałem za interesujące:

Wniosek

Z powyższych wyników jasno wynika, że ​​nowy model Davinciego zapewnia znacznie wyższą jakość pisania przy dłuższych wynikach. Oprócz tych ulepszeń, styl pisania jest pouczający, z punktami praktycznymi i sekwencyjnymi.

Oczywiście koszt będzie brany pod uwagę, aw środowisku produkcyjnym zamierzone zadania i oczekiwane wyniki będą musiały zostać porównane z kosztami i wydajnością innych modeli.

⭐️ Śledź mnie na LinkedIn , aby uzyskać najlepsze treści konwersacyjne AI ⭐️

Obecnie jestem Głównym Ewangelistą @ HumanFirst . Odkrywam i piszę o wszystkich rzeczach na styku sztucznej inteligencji i języka; począwszy od LLM , Chatbotów , Voicebotów , Frameworków programistycznych, ukrytych przestrzeni Data-Centric i innych.

https://www.linkedin.com/in/cobusgreyling
Cobus Quadrant™ projektowania NLU Cobus Quadrant™ możliwości projektowania konwersacji
Wdrażanie sztucznej inteligencji zorientowanej na dane dla modeli NLU rozwiązujących długi ogon dystrybucji intencji