Nowa funkcja edycji DALL-E OpenAI pokazuje, jak daleko ma do osiągnięcia sztuczna inteligencja

OpenAI stanęło przed częstym problemem generatorów obrazów AI, kiedy w tym miesiącuszeroko udostępniło nową funkcję edycji dla DALL-E firmy ChatGPTCzęsto generatory obrazów AI błędnie rozumieją, co chcesz utworzyć, dlatego nowe narzędzie OpenAI pozwala wyróżnić sekcje obrazu i zmienić je zgodnie ze specyfikacjami. Narzędzie brzmi świetnie w teorii, jednak w praktyce pozostawia wiele do życzenia.
Gizmodo przeprowadził kilka testów nowego narzędzia edycyjnego DALL-E, które jest bardzo podobne do funkcji wypełniania generatywnego Firefly w programie Adobe Photoshop . Chociaż DALL-E OpenAI jest jednym z najlepszych generatorów obrazów AI na rynku, narzędzie do edycji jest nieco rozczarowujące. W idealnym przypadku narzędzie do edycji zdjęć powinno umożliwiać zmianę błędnych elementów obrazu. W dużej mierze odkryliśmy, że narzędzie edycyjne DALL-E odmawia lub po prostu nie wyświetla tego, o co prosisz. W niektórych przypadkach całkowicie psuje zdjęcie.
Narzędzie podkreśla kluczowy czynnik ograniczający generatory obrazów AI: nie mają oni pojęcia, co do cholery robią. W pewnym momencie, gdy korzystałem z funkcji edycji DALL-E, ChatGPT powiedział mi: „Niestety nie mogę bezpośrednio edytować obrazów ani zmieniać w nich określonych elementów”. Dzieje się tak dlatego, że sztuczna inteligencja nie wie, co stworzyła. Nie jest w stanie stwierdzić, czy jest pierwszy plan, tło, ani nawet jaki znak, który stworzył, mówi.
Zatem funkcja edycji tak naprawdę w ogóle nie „edytuje” zdjęcia. W rzeczywistości edytuje monit i generuje nowe zdjęcie za każdym razem w określonym obszarze. W rezultacie funkcja edycji DALL-E nie zapewnia precyzji i kontroli, jakich można oczekiwać od narzędzia do edycji.
Aby móc korzystać z narzędzia edycji, musisz zrozumieć ograniczenia DALL-E. Aby jak najlepiej wykorzystać tę funkcję, naprawdę musisz zastosować się do jasnych instrukcji i poprosić jedynie o dość proste zmiany. Zakładanie komuś urodzinowej czapki, zmiana sceny z dnia na noc lub inne proste zmiany zwykle sprawdzały się w naszych testach, choć bardziej skomplikowane zmiany nie.
Szczerze mówiąc, dotyczy to obecnie wszystkich narzędzi do edycji w generatorach obrazów AI. Za każdym razem generują coś nowego, co może zniekształcić Twój wizerunek. Chociaż edytor działa w ograniczonych okolicznościach, nie oferuje możliwości dostosowania, na jakie możesz liczyć. Oto nasze testy z edytorem obrazów DALL-E.

