BARD VS ChatGPT: Testowanie problemów analitycznych

MOŻEMY SIĘ POŁĄCZYĆ NA :| LINKEDIN | TWITTERA | ŚREDNI | SUBSTACK |
10 maja najbardziej rozreklamowany i najsilniejszy konkurent Google dla ChatGPT, BARD, pojawił się na żywo w Indiach. Moja fascynacja nie pozwoliła mi przestać porównywać Barda z ChatGPT, a oto kilka niesamowitych porównań.
Na tym blogu porównuję chatGPT oparty na GPT 3 z BARD, a nie GPT4. Google Bard i ChatGPT to duże modele językowe, ale mają pewne kluczowe różnice. Google Bard jest większy i został przeszkolony na bardziej zróżnicowanym zbiorze danych, co daje mu szerszy zakres wiedzy i umiejętności. ChatGPT jest mniejszy i został przeszkolony na bardziej ograniczonym zbiorze danych, co czyni go mniej dokładnym i kreatywnym. Jednak ChatGPT jest również tańszy i szerzej dostępny niż Google Bard.
Oto tabela porównująca Google Bard i ChatGPT:

Dość teorii i twierdzeń. Sprawdźmy rzeczywiste wyniki.
(PRAWDZIWE) porównanie:
Istnieje wiele metod porównywania, jednak ja skłaniam się ku porównywaniu zdolności analitycznych . Umiejętności analityczne są głównym czynnikiem odróżniającym ludzi od systemów, ponieważ konstruowanie procesu myślowego, angażowanie się w rozumowanie, a następnie odpowiadanie na pytania, może stanowić większe wyzwanie dla modeli językowych. Przejdźmy do analizy wyników.
Pytanie 1:
- Jeśli 1=3, 2=3, 3=5, 4=4, 5=4, to 6=?
ChatGPT

BARD

ChatGPT nie mógł zrozumieć związku między liczbami. Mimo że było to trudne dla BARD, w pierwszym akapicie BARD odpowiedział słusznie.
Pytanie 2:
Na wystawę zgłoszonych jest 49 psów. Małych psów jest o 36 więcej niż dużych. Ile małych psów zgłosiło się do rywalizacji?
Odpowiedź: Aby dowiedzieć się, ile małych psów bierze udział w zawodach, musisz odjąć 36 od 49, a następnie podzielić wynik 13 przez 2, aby otrzymać 6,5 psów, czyli liczbę dużych psów biorących udział w zawodach. Ale jeszcze nie skończyłeś! Następnie musisz dodać 6,5 do 36, aby uzyskać liczbę startujących małych psów, która wynosi 42,5. Oczywiście nie jest możliwe, aby połowa psa brała udział w wystawie, ale ze względu na ten problem matematyczny załóżmy, że tak.
ChatGPT

BARD

W tym pytaniu oba modele działały dobrze. Obaj otrzymali niezłe uzasadnienie i COT za pracę nad odpowiedziami.
Pytanie 3:
Mężczyzna wspina się na górę, która jest nachylona. Aby dostać się na szczyt góry, musi przebyć 100 km. Codziennie wspina się 2 km do przodu w ciągu dnia. Wyczerpany odpoczywa tam w nocy. W nocy, kiedy śpi, zsuwa się w dół 1 km do tyłu, ponieważ góra jest nachylona. W takim razie ile dni zajmuje mu dotarcie na szczyt góry?
Odpowiedź:Wysokość pierwszego dnia osiągnęła 2 km
1. noc -1 km
efektywna wspinaczka na początku drugiego dnia to 1km
Wysokość drugiego dnia osiągnięta 3 km
2. noc -1 km
efektywna wspinaczka na początku dnia 3 to 2km
Wkrótce…
efektywne wzniesienie na początku dnia 98 to 97km
Wysokość 98-go dnia osiągnęła 99 km
98 noc -1km
efektywna wspinaczka na początku dnia 99 to 98km
Wysokość osiągnięta w 99 dniu to 100 km
ChatGPT

BARD

W tym problemie BARD to załatwił. Była sztuczka, której GPT nie mógł zrozumieć.
Pytanie 4:
Trzy osoby mają tendencję do kłamania przez 1/3 czasu. Wszyscy widzą rzut monetą. Wszyscy mówią, że to Heads. Jakie jest prawdopodobieństwo, że to rzeczywiście Heads?
Odpowiedź:Ogólnie rzecz biorąc, istnieje prawdopodobieństwo (1/3)*(1/3)*(1/3) = 1/27, że wszyscy kłamią i (2/3)*(2/3)*(2 /3) = 8/27 szans, że wszyscy powiedzieli prawdę. Ponieważ wiemy, że wszyscy udzielili tej samej odpowiedzi, są to jedyne dwie opcje. Tak więc prawdopodobieństwo, że to reszki (wszyscy mówią prawdę) wynosi: (8/27)/((8/27)+(1/27)) = 8/9.
ChatGPT


BARD

Ciekawy! Gra prawdopodobieństwa !!! Ponownie BARD odpowiedział dobrze.
Podobnie przetestowałem wiele pytań dotyczących matematyki analitycznej i stwierdziłem, że BARD jest lepszy , jak twierdzono. Jednak może być inna historia, kiedy zastąpimy GPT3 GPT 4. Bitwa o BARD i GPT4 w tym samym formacie. Zaraz zrobię to porównanie.
Ostatecznie najlepszy wybór dla Ciebie będzie zależał od Twoich konkretnych potrzeb i wymagań. Jeśli potrzebujesz dużego modelu językowego z szerokim zakresem wiedzy i umiejętności, Google Bard jest lepszym wyborem. Jeśli szukasz mniejszego i tańszego modelu językowego, ChatGPT jest dobrą opcją .
Możesz przetestować oba modele zgodnie z wydajnością swojej niszy i dokumentu.
ChatGPT: Kliknij tutaj
Bard: Kliknij tutaj
Jeśli uważasz, że ten artykuł jest wnikliwy
Udowodniono, że „ szczodrość czyni cię szczęśliwszym człowiekiem ”; dlatego poklaskuj artykuł, jeśli ci się spodobał. Jeśli ten artykuł był dla Ciebie wartościowy, śledź mnie na Linkedin i medium . Możesz także zapisać się , aby otrzymywać powiadomienia, gdy opublikuję artykuły. Stwórzmy społeczność! Dziękuję za wsparcie!
Możesz przeczytać inne moje blogi związane z:
Opanowanie dużych modeli językowych: CZĘŚĆ 1 Konwersja danych do formatu SQuAD w celu dostrojenia modeli LLMBądź na bieżąco z najnowszymi wiadomościami i aktualizacjami w kreatywnej przestrzeni AI — śledź publikację Generative AI .