Wydawcy przyznają OpenAI swoje treści na najwyższym miejscu w odpowiedziach ChatGPT

Apr 30 2024
OpenAI mówi wydawcom, że porzucą treść lub pozostaną w tyle.

„Financial Times” ogłosił w poniedziałek zawarcie umowy z OpenAI na udzielenie licencji swojemu światowej klasy dziennikarstwu na szkolenie i informowanie modeli ChatGPT . Dołącza do Axela Springera i Associated Press, które zawarły podobne umowy, w ramach których OpenAI podobno oferuje miliony za prawo do korzystania z treści. Jednakże ChatGPT został przeszkolony w zakresie wielu innych treści pochodzących z Internetu, za które OpenAI nie zapłaciło. Dlaczego więc OpenAI płaci za niektóre zbiory danych, a za inne nie?

powiązana zawartość

Sztuczna inteligencja w tym tygodniu: strajk hollywoodzkich pisarzy mógł się zakończyć, ale bitwa o sztuczną inteligencję jest daleka od zakończenia
PensylwaniaGPT ma halucynacje przy sernikach

Umowy licencyjne OpenAI wydają się dawać jasny komunikat: i tak będziemy korzystać z Twoich treści, więc podpisz z nami umowę lub zostań w tyle. Wydaje się, że główna zaleta umowy licencyjnej zajmuje ważne miejsce w odpowiedziach ChatGPT. Niektórzy wydawcy mogą także chcieć umocnić relacje z kolejnym dużym kanałem dystrybucji informacji, zanim przejmie on kontrolę. Wygląda jednak na to, że OpenAI i tak korzysta z wielu treści wydawców.

powiązana zawartość

Sztuczna inteligencja w tym tygodniu: strajk hollywoodzkich pisarzy mógł się zakończyć, ale bitwa o sztuczną inteligencję jest daleka od zakończenia
PensylwaniaGPT ma halucynacje przy sernikach
Dlaczego wszyscy pozywają firmy zajmujące się sztuczną inteligencją? | Technologia przyszłości
Udział
Napisy na filmie obcojęzycznym
  • Wyłączony
  • język angielski
Udostępnij ten film
Facebook Twitter E-mail
Link do Reddita
Dlaczego wszyscy pozywają firmy zajmujące się sztuczną inteligencją? | Technologia przyszłości

Według CTO Miry Murati, OpenAI już częściowo szkoli swoje modele sztucznej inteligencji na „ publicznie dostępnych danych ”, co wydaje się celowo niejasne. Czym w ogóle są dane publicznie dostępne? Wyrażenie zakłada, że ​​wszystko, co można przeczytać w Internecie, można również bezpłatnie wbudować w ChatGPT. Na przykład Gizmodo jest częścią „publicznie dostępnych danych” OpenAI. Nasza witryna internetowa została zapisana w pamięci podręcznej ponad 34 000 razy w zbiorze danych WebText GPT-2 , ostatnim zbiorze danych ujawnionym przez OpenAI, używanym do uczenia modelu sztucznej inteligencji.

Gizmodo jest bezpłatne dla czytelników głównie ze względu na reklamy na tej stronie. Jeśli czytelnicy mogą uzyskać dostęp do naszych treści za pośrednictwem ChatGPT, łamie to nasz model biznesowy. New York Times, który jest znacznie częściej wykorzystywany w zbiorze danych WebText GPT-2, pozwał OpenAI za naruszenie praw autorskich właśnie w tej sprawie.

Umowa licencyjna na treści z OpenAI wydaje się jedynym sposobem, w jaki wydawcy mogą pozostać aktualni w erze sztucznej inteligencji. W komunikacie prasowym dyrektor generalny Financial Times Group, John Ridding, twierdzi, że ta umowa „poszerzy zasięg” ich pracy, zapewniając jednocześnie „wczesny wgląd w sposób, w jaki treści są ujawniane za pomocą sztucznej inteligencji”.

„Problem ze sztuczną inteligencją polega na tym, że tak naprawdę nie jest to sztuczna inteligencja” – powiedział w wywiadzie dla Gizmodo Matthew Butterick, prawnik reprezentujący Sarah Silverman i innych autorów książek pozywających OpenAI. „To ludzka inteligencja zebrana w jednym miejscu, oddzielona od jej twórców, a następnie ta wielka firma technologiczna ustala cenę i sprzedaje ją komuś innemu”.

Butterick jest powodem w sześciu procesach dotyczących praw autorskich przeciwko firmom zajmującym się sztuczną inteligencją. Jest także pisarzem, programistą i projektantem, więc twierdzi, że rozumie, w jaki sposób sztuczna inteligencja może zagrozić tym branżom. Najogólniej jego sprawy skupiają się wokół twierdzenia, że ​​sztuczna inteligencja jednocześnie wykorzystuje pracę twórców i zagraża ich źródłom utrzymania.

Umowy licencyjne OpenAI wzbudziły zdziwienie w związku z treściami, z których ChatGPT korzysta bezpłatnie. Firmy technologiczne argumentują, że generatywna sztuczna inteligencja stanowi „dozwolony użytek” dzieł chronionych prawem autorskim, ponieważ przekształca je w coś nowego. Świat sztucznej inteligencji argumentuje również, że korzysta z modelu podobnego do wyszukiwarki Google, która buforuje treści chronione prawem autorskim, tworząc przydatne narzędzie do wyszukiwania informacji. Podobnie jak Google, chatboty AI zaczęły ostatnio dołączać hiperłącza. Ostatecznie sąd będzie musiał zdecydować, czy generatywna sztuczna inteligencja stanowi „dozwolony użytek”.

OpenAI nie odpowiedziało natychmiast na prośbę Gizmodo o komentarz.

Wydaje się, że autorzy i wydawcy książek nie są jedynymi, od których OpenAI czerpie treści. Niedawno dziennik „The New York Times” doniósł, że OpenAI przeszkoliło GPT-4 na ponad milionie godzin transkrypcji filmów z YouTube . Na kilka dni przed publikacją raportu dyrektor generalny YouTube stwierdził, że wykorzystywanie jego filmów do szkolenia w zakresie sztucznej inteligencji byłoby „wyraźnym naruszeniem” zasad serwisu.

Licencjonowanie treści OpenAI zaciemnia dyskusję. Firma w jakiś sposób bezpłatnie korzysta z treści internetowych, płacąc jednocześnie innym za ich pracę. Inne firmy technologiczne, takie jak Apple, podobno bardziej aktywnie płacą za wszystkie swoje dane szkoleniowe. Według doniesień Adobe płaciło 3 dolary za minutę wideo, aby wyszkolić generator wideo AI.

Nie jest jednak jasne, czy nawet jednorazowa opłata za uzyskanie danych szkoleniowych AI wystarczy. Mówimy o narzędziu, które może potencjalnie zmienić branżę medialną dla pisarzy, producentów audio i wideo i nie tylko. Podpisanie umowy z OpenAI może zagwarantować Ci dobre miejsce w wynikach ChatGPT, ale wygląda na to, że chatbot AI i tak mógł korzystać z Twoich treści. Przynajmniej na razie firmy zajmujące się sztuczną inteligencją chętnie wykorzystują wszystko, co jest w Internecie, a później zadają pytania dotyczące legalności tego wszystkiego.