Home
» Wiki
»
Jak korzystać z narzędzi do edycji DALL-E 3
Jak korzystać z narzędzi do edycji DALL-E 3
Czy kiedykolwiek chciałeś edytować swoją pracę w DALL-E 3 w locie, ale nie wiedziałeś jak? Dobra wiadomość jest taka, że OpenAI dodało narzędzia do edycji inline w DALL-E 3 w ChatGPT, dzięki czemu możesz edytować swoją pracę bez opuszczania aplikacji.
Jedyny problem polega na tym, że nie robią tego, co reklamuje OpenAI, i trudno powiedzieć, czy uzyskujesz pożądane edycje. Jest to jednak dopiero początek tego, co czeka nas w procesie edycji DALL-E 3. Oto, jak to działa.
Jakie jest narzędzie do edycji DALL-E 3?
Istnieją już od jakiegoś czasu, ale OpenAI w końcu dodało funkcjonalność edycyjną do DALL-E 3 w ChatGPT Plus. Przedtem możesz spróbować edytować swoje dzieła DALL-E 3, ale zazwyczaj skutkuje to powstaniem zupełnie nowego obrazu. Nawet jeśli monit użyty do stworzenia edytowanego obrazu jest bardzo podobny do pierwszego monitu, ze względu na naturę generatywnej sztucznej inteligencji, wynik może się znacząco różnić.
Wbudowane narzędzia edycyjne DALL-E 3 mają teraz na celu naprawianie problemów w obrębie tego samego obrazu, bez konieczności tworzenia nowych monitów. Zaznaczasz obszar na obrazie, który chcesz dostosować, wydajesz oprogramowaniu DALL-E polecenie dokonania określonej zmiany (np. „usuń to” lub „dodaj tę funkcję”) i działa.
Przykład narzędzia do edycji DALL-E 3
Przykład na oficjalnym blogu OpenAI pokazuje, jak DALL-E dodaje kwiaty wiśni do obrazu kota w stylu Ukiyo-e i wszystko działa doskonale. Z doświadczenia wynika, że narzędzia edycyjne DALL-E mają trudności z dodawaniem tak szczegółowych obrazów do istniejących obrazów i w większości nie radzą sobie z żądaniami tego typu.
Nie oznacza to jednak, że narzędzia do edycji nie działają. Mogą całkowicie usunąć pewne funkcje i wprowadzić niewielkie zmiany, jak opisano poniżej, ale wszystko na małą skalę.
Jak korzystać z narzędzi do edycji DALL-E 3
Najlepszym sposobem pokazania możliwości narzędzi edycyjnych DALL-E 3 jest podanie kilku odpowiednich przykładów.
Usuń i skasuj
Narzędzia edycyjne DALL-E 3 potrafią usunąć pewne drobne szczegóły, ale jest to zdecydowanie uciążliwe. Na poniższym zdjęciu autor artykułu poprosił DALL-E o stworzenie „robotycznej ręki trzymającej przezroczysty, świecący kwadratowy chip z napisem „AI Accelerated”. Tło jest ciemnoniebieskie, co tworzy futurystyczną i zaawansowaną technologicznie atmosferę”.
Tekst pisany stanowi problem dla Generative AI, więc nie ma się co dziwić, że tekst jest błędny. Autor poprosił więc DALL-E o usunięcie literówki. Pierwsza próba zakończyła się niepowodzeniem i wyświetlono monit „usuń to słowo”, ale powiodła się za drugim razem i wyświetlono monit „usuń to słowo z obrazka”. Dlatego może być konieczne wypróbowanie różnych monitów, aby uzyskać pożądany rezultat. Następnie autor poprosił komputer o przeniesienie liter AI do środka kwadratu, co zadziałało prawidłowo, chociaż z jakiegoś powodu komputer się zawiesił.
Następnie autor poprosił DALL-E o edycję obrazu przedstawiającego telewizor. Format DALL-E świetnie nadaje się do tworzenia wyjątkowych obrazów, jednak zawiera niepoprawne szczegóły lub zniekształca tekst. W tym przypadku pasek informacyjny na ekranie telewizora pokazuje bezsensowny tekst sztucznej inteligencji, więc autor chce go usunąć. Pierwsza próba użycia DALL-E pozostawiła cień na pasku informacyjnym, druga i trzecia próba były znacznie czystsze. Nie jest idealny, ale wystarczająco dobry do początkowego wykorzystania.
Dodaj i zmień
DALL-E 3 może wprowadzić pewne zmiany w obrazie, ale wszystko zależy od skali treści, której potrzebujesz. Mogą pojawić się drobne uzupełnienia i zmiany, ale w większości przypadków narzędzie edycyjne DALL-E nie jest w stanie obsłużyć tego, co jest wymagane.
Autor poprosił firmę DALL-E o „stworzenie obrazu 4K 2:1 z bliska przedstawiającego ludzkie oko, z najdrobniejszymi szczegółami”, czego efektem był następujący obraz:
Narzędzie do edycji zbliżeń ludzkiego oka
Całkiem niezłe (poza rzęsami), ale autor chciał zmienić kolor tęczówki na niebieski, co zaowocowało tym obrazkiem:
Narzędzie do edycji zmiany koloru oka ludzkiego
Kolor jest nieco przygaszony, ale niezmieniony, niektóre szczegóły są lekko zakrzywione.
Następnie autor poprosił firmę DALL-E o „stworzenie obrazu w formacie 4K 2:1 w stylu animacji poklatkowej przedstawiającego osobę ubraną w kostium tygrysa, zjeżdżającą na nartach z górki na tle bałwana ” .
Ponownie, oryginalny obraz jest dobry, ostry, o żywych kolorach i zgodny z opisem. Jednak autor chciał zmienić yeti na inny rodzaj przerażającego zwierzęcia.
Bałwan został usunięty z obrazka.
Zamiast zamienić się w inne zwierzę, bałwan całkowicie zniknął. Autor powrócił do oryginalnego obrazu i poprosił o namalowanie innego bałwana, ale się nie udało. Podobnie było, gdy autor poprosił o dodanie do obrazu większej liczby drzew.
Dodaj tekst
Mimo to sztuczna inteligencja generatywna często ma problemy z tekstem, a dodawanie tekstu do obrazów jest jeszcze trudniejsze. Autor poprosił DALL-E o stworzenie pocztówki przedstawiającej wybrzeże Anglii i pocztówka ta doskonale oddała ten widok. Autor chciał dodać do obrazu tekst „Słoneczny Brzeg”, ale narzędzie nie potrafiło sobie z tym poradzić.
Oznacza to, że po około 6 lub 7 monitach przypominających DALL-E, co musi zrobić, narzędzie utworzyło zupełnie nowy obraz z żądanym tekstem.
Następna jest kartka urodzinowa. Tym razem DALL-E dodał „Wszystkiego najlepszego z okazji urodzin” bez pytania. Autor poprosił więc o dodanie daty urodzin do kartki. Ponownie, DALL-E nie dodał daty do karty, ale po kilku monitach utworzył nowy obraz z żądaną datą. W takim przypadku łatwiej jest dodać datę samodzielnie, zwłaszcza jeśli chcesz zachować oryginalne zdjęcie.
Narzędzia edycyjne DALL-E są przydatne, ale wymagają odrobiny cierpliwości
Narzędzia edycyjne DALL-E są przydatne w przypadku niektórych zadań, ale ich prawidłowa edycja może zająć trochę czasu. W wielu przypadkach to nie zadziała i prawdopodobnie lepiej wziąć oryginalny monit i zmodyfikować go, aby utworzyć nowy obraz.
Narzędzia edycyjne DALL-E zapewne z czasem będą coraz lepsze, ale do tego czasu lepiej edytować zdjęcia za pomocą edytora obrazów, niż uczestniczyć w wielu czasochłonnych rozmowach z DALL-E.