Mimo że od czasu premiery DALL-E poczynił znaczne postępy, jest on daleki od ideału. Narzędzie do tworzenia sztuki ma szereg wad, które należy rozwiązać, a wiele z nich staje się bardziej widocznych podczas regularnego użytkowania. Nieścisłości i nieprawidłowe rozmiary to tylko niektóre przykłady.
Chociaż sztuczna inteligencja nie radzi sobie najlepiej z pisaniem tekstu na obrazach, po wypróbowaniu dziesiątek narzędzi do tworzenia grafiki wykorzystujących sztuczną inteligencję DALL-E okazuje się jedną z najgorszych opcji w tym zakresie. Generalnie rzecz biorąc, proste prośby okażą się skuteczne, jednak jak widać poniżej, program nadal ma problemy z wpisywaniem znaków diakrytycznych dla słowa „Café”.
Obraz kawiarni stworzony w DALL-E
Zauważysz również, że DALL-E nie generuje czytelnego tekstu dla znaków drogowych i podobnych obiektów.
2. Nie zmieniaj rozmiaru obrazów, gdy zostaniesz o to poproszony
DALL-E doskonale rozumie potrzebę tworzenia obrazu, ale nie potrafi zmienić jego rozmiaru, gdy zachodzi taka potrzeba. Na przykład autor artykułu poprosił oprogramowanie o wielokrotną zmianę rozmiaru obrazów na potrzeby różnych blogów; Jednak za każdym razem DALL-E po prostu odtwarza obraz.
Na szczęście przycinanie i zmiana rozmiaru zdjęć jest dość prosta. Istnieje wiele bezpłatnych narzędzi, np. Canva , które to umożliwiają. Jednak byłoby miło, gdyby dało się tego dokonać bez korzystania z oprogramowania firm trzecich.
3. Nie można tworzyć realistycznych obrazów
DALL-E nie ma większych problemów z głębią ostrości, ale nie radzi sobie dobrze z tworzeniem realistycznych obrazów. Na przykład autor artykułu najpierw prosi sztuczną inteligencję o wygenerowanie obrazu złotego retrievera w górach poniżej (nie określając, jaki to typ obrazu).
Obraz psa na górze stworzony przy użyciu DALL-E
Zdjęcie jest piękne, ale widać, że zostało stworzone przy użyciu sztucznej inteligencji. Autor poprosił więc firmę DALL-E o nadanie obrazowi bardziej fotorealistycznego wyglądu. Jednak efekt końcowy wygląda jeszcze bardziej sztucznie (nawet trochę strasznie).
Korzystanie z GPT w celu dostosowania zdjęcia jest przydatne, ale aby uzyskać do niego dostęp, potrzebna jest płatna subskrypcja. Alternatywnie możesz skorzystać z wielu narzędzi do tworzenia grafiki wykorzystujących sztuczną inteligencję, takich jak Adobe Firefly, które dają fotorealistyczne efekty.
4. Oprogramowanie nie słucha, gdy mówisz mu, żeby czegoś nie robił
Jednym ze sposobów na tworzenie lepszych przypomnień w Midjourney , ChatGPT i innych narzędziach AI jest określenie, czego nie chcesz, aby oprogramowanie robiło. W wielu przypadkach takie postępowanie przyniesie lepsze rezultaty. Jednakże DALL-E jest wyjątkiem.
W wielu przypadkach autor prosił DALL-E, aby nie uwzględniał pewnych elementów na swoich zdjęciach. Mimo to narzędzie nadal je dodaje. Czasami ponowne obrazowanie może pomóc, ale lepiej tego nie robić.
Natomiast korzystając z programu Adobe Firefly, problem ten rzadko będzie występował.
5. Niespójność w niektórych obszarach
Wiele narzędzi do tworzenia sztuki opartych na sztucznej inteligencji ma słabości; Przykładowo, podczas testów Photo AI program wyjątkowo słabo radził sobie z tworzeniem dłoni. W DALL-E występują również błędy i nieścisłości w wielu obszarach.
Choć DALL-E świetnie sprawdza się w generowaniu obrazów ogólnie rzecz biorąc, nie zawsze dobrze radzi sobie z generowaniem obrazów osób trzymających przedmioty. Ponadto oprogramowanie to nie nadaje się dobrze do tworzenia ekranów komputerowych. Zazwyczaj daje losowy zestaw kształtów. Czasami może pomóc poproszenie oprogramowania o wyłączenie ekranu komputera.
6. Niespójny styl obrazu
DALL-E może generować kilka typów obrazów; Możesz tworzyć dzieła sztuki przy użyciu sztucznej inteligencji, które wyglądają jak obrazy malowane, a także obrazy wyglądające bardziej trójwymiarowo. Jednakże ta różnorodność w kreowaniu wizerunku może czasami prowadzić do niespójnych stylów.
Zlecając programowi DALL-E utworzenie obrazu, musisz dokładnie określić, czego chcesz. W przeciwnym wypadku możesz otrzymać coś losowego. Nie stanowi to problemu, jeśli po prostu testujesz aplikację, ale ma znaczenie, jeśli zależy Ci na spójnym stylu.
7. Rozmiar artefaktu
Jeśli zależy Ci na dokładności zdjęcia, ważne jest, aby obiekty na zdjęciu wyglądały proporcjonalnie do swoich rzeczywistych odpowiedników. Niestety, czasami DALL-E nie sprawia, że obiekty wyglądają tak, jak powinny. Na przykład, jeśli poprosisz oprogramowanie o wygenerowanie obrazu osoby trzymającej telefon w dłoni, czasami telefon będzie za duży.
Chociaż próbowałem poprosić oprogramowanie o poszerzenie obrazu, aby rozwiązać problem, to tylko pogorszyło sprawę, sprawiając, że końcowy obraz wyglądał na sztuczny. Wypróbowanie różnych żądań edycji DALL-E może przynieść skutek, ale ogólnie rzecz biorąc nie ma jeszcze obejścia tego problemu.
Obraz przedstawiający osobę trzymającą telefon, stworzony w DALL-E
8. DALL-E ma trudności z tworzeniem materiałów zewnętrznych
Na pierwszy rzut oka DALL-E może wydawać się świetnym narzędziem do tworzenia osobistych kalendarzy, kartek urodzinowych, tapet na telefon itp. Szybko jednak odkryjesz, że oprogramowanie to nie sprawdza się zbyt dobrze w tym obszarze.
Przykładowo, próbując stworzyć okładkę kartki urodzinowej za pomocą DALL-E, autor tego artykułu chciał utworzyć obraz w aplikacji, a następnie przesłać go do usługi takiej jak Moonpig. Niestety, efektem jest zawsze projekt z kartką urodzinową na zdjęciu.
Błędy w tekście i projekcie kartki urodzinowej w DALL-E 3
Jeśli naprawdę chcesz użyć DALL-E do tego typu projektów, nie powinieneś mówić, że zamierzasz użyć go na kartce urodzinowej. Zamiast tego określ, co chcesz, aby program robił, a rozmiar dostosujesz później.
Uwaga : Najlepiej po prostu utworzyć obraz w DALL-E i dodać tekst w innej aplikacji.
9. Na obrazku nie są pokazane wszystkie opcjonalne wymagania
Czasami nie wiesz, jaki konkretny projekt sztucznej inteligencji chcesz wykorzystać. W takich przypadkach sensowne może okazać się skorzystanie z generatora i poproszenie go o utworzenie wielu wariantów obrazu. Jednak z własnego doświadczenia wiem, że DALL-E jest często dość „leniwy”, gdy użytkownicy pytają o wiele opcji.
W wielu przypadkach otrzymane zdjęcia wyglądają bardzo podobnie. Dlatego musisz pytać konkretnie. Tworzenie jednego obrazu po drugim jest bardziej efektywne niż tworzenie wielu wariantów.
Mimo że wiele osób nadal chętnie korzysta z DALL-E, oprogramowanie to nie jest doskonałe i prędzej czy później użytkownik będzie miał problemy. Przykładowo, nie radzi sobie z tworzeniem fotorealistycznych obrazów bez niestandardowego GPT. Co więcej, oprogramowanie to często nie eliminuje elementów, których nie chcesz widzieć na zdjęciu. Jeśli jednak napotkasz tego typu problemy, powinieneś wypróbować DALL-E i przekonać się samemu.