Home
» Wiki
»
Dlaczego sztuczna inteligencja nie potrafi pisać tekstu na obrazach?
Dlaczego sztuczna inteligencja nie potrafi pisać tekstu na obrazach?
Jeśli do tworzenia obrazów korzystałeś z narzędzi Generative AI , mogłeś napotkać problemy z pisaniem tekstu na obrazach. Wiedza o przyczynach takiego stanu rzeczy pomoże uniknąć tego problemu, a także znaleźć sposoby jego rozwiązania.
Dlaczego sztuczna inteligencja nie potrafi pisać tekstu na obrazach?
Najczęstszym powodem, dla którego sztuczna inteligencja nie potrafi pisać tekstu, są wcześniejsze dane wejściowe. Choć sztuczna inteligencja generalnie całkiem dobrze radzi sobie z generowaniem obrazów, niektóre jej aspekty, np. tekst, nie były wykorzystywane na takim samym poziomie do trenowania dużych modeli językowych (LLM) . Dlatego sztuczna inteligencja nie radzi sobie zbyt dobrze z generowaniem tekstu na obrazach.
Mimo że narzędzia AI są już bardzo zaawansowane, pod względem technicznym wciąż znajdują się na wczesnym etapie rozwoju. Co więcej, niektórym narzędziom AI kończą się dane treningowe. Istnieje jeszcze szansa, że narzędzia generatora będą w stanie wygenerować lepszy tekst, ale na razie musisz wypróbować alternatywę.
Czy istnieje alternatywa dla nieczytelnego tekstu w obrazach AI?
Choć generowanie tekstu na obrazach AI jest dość trudne, nie jest niemożliwe. Oto najskuteczniejsze metody na chwilę obecną...
1. Podaj narzędziu bardziej szczegółowe monity
Kiedy ludzie zaczynają korzystać ze sztucznej inteligencji, ich umiejętności szybkiego pisania są często poniżej standardów. Największym błędem jest dawanie niejasnych wskazówek, takich jak „stwórz obraz sceny ulicznej”.
Nic dziwnego, że otrzymujesz wyniki poniżej standardów. Najlepszym sposobem wykorzystania Generative AI jest potraktowanie swojego polecenia jako kreatywnego opisu. Im bardziej szczegółowo, tym lepiej. Oto przykładowy monit:
Stwórz obraz zewnętrznej części włoskiej kawiarni. Chcę, żeby był tam napis „Café” i żeby był to słoneczny dzień.
Tłumaczenie przybliżone : Stwórz zewnętrzny wizerunek włoskiej kawiarni. Chcę, aby na znaku znajdował się napis „Café” w słoneczny dzień.
Jak widać na poniższym obrazku, ChatGPT poradził sobie całkiem nieźle. Nie wydarzyłoby się to, gdybyś po prostu powiedział: „Stwórz zewnętrzny wizerunek włoskiej kawiarni”.
Obraz kawiarni stworzony w DALL-E
Z mojego osobistego doświadczenia wynika, że proste obrazy są skuteczniejsze. Na przykład powyższy obraz ma mniej elementów niż testowany obraz poniżej — co oznacza, że sztuczna inteligencja ma mniej do nauczenia się.
Scena uliczna dostosowana w aplikacji DALL-E 3
2. Użyj odmian słowa „Tekst”
Niewielka zmiana języka komunikatu może mieć duże znaczenie. Po kilku próbach użycia terminu „tekst” zaczniesz mieć wrażenie, że kręcisz się w kółko, dlatego spróbuj różnych synonimów.
Na przykład zamiast „tekst” możesz spróbować:
Tytuł
Alfabet
Słowo pisane
Symbol
Jeśli żadne z tych rozwiązań nie zadziała, wypróbuj inne rozwiązania. To, co działa, a co nie, może się różnić w zależności od tego, co próbujesz stworzyć. Na przykład, prawdopodobnie nie użyłbyś słowa „symbol”, próbując zaprojektować kartkę urodzinową. Kluczowe jest tutaj eksperymentowanie z różnymi pomysłami na podpowiedzi sztucznej inteligencji, a różne narzędzia mogą działać na różne sposoby.
3. Dodaj tekst za pomocą narzędzi do zamiany
Nie należy dodawać tekstu za pomocą narzędzi do zamiany, jeśli słowa mają stanowić część obrazu, ale to dobry pomysł, jeśli próbujesz utworzyć więcej grafik. Sprawdzi się, jeśli chcesz zaprojektować kartkę, grafikę, okładkę książki lub coś podobnego.
Jeżeli chcesz to zrobić, upewnij się, że na obrazie jest wystarczająco dużo miejsca. Możesz użyć dowolnego narzędzia, aby dodać tekst do obrazu. Zalecanymi opcjami są Canva lub Adobe Photoshop Express, ale inne aplikacje umożliwiające dodawanie tekstu do obrazów na smartfonie również będą działać z treściami tworzonymi za pomocą sztucznej inteligencji.
Należy również upewnić się, że tekst jest zgodny z obrazem wygenerowanym przez sztuczną inteligencję. Używaj czcionek, które odzwierciedlają nastrój, jaki chcesz przekazać, i nadawaj przedmiotom inny kształt, jaki uważasz za konieczny.
4. Zachowaj krótki tekst
Generowanie tekstu na obrazach za pomocą sztucznej inteligencji często kończy się niepowodzeniem, ponieważ próbujesz dodać zbyt dużo tekstu. Szczerze mówiąc, dzieje się tak za każdym razem, gdy próbujesz utworzyć tekst dłuższy niż 10 znaków. Podobnie jak w przypadku rekomendacji, aby obrazy były proste, tak samo należy zadbać o to, aby tekst był krótki.
Aby to sprawdzić, autor wypróbował inny monit:
Proszę wygenerować obraz banku z napisem „bank” na zewnątrz. Chcę, żeby znajdował się w śródmieściu i miał nowoczesną konstrukcję, taką jaką można zobaczyć w amerykańskich miastach.
Tłumaczenie przybliżone : Narysuj obraz banku ze słowem „bank” na zewnątrz. Chciałem, żeby znajdowało się w centrum miasta i miało nowoczesną strukturę, taką, jaką można zobaczyć w amerykańskich miastach.
Jak widać poniżej, silnik AI całkiem dobrze poradził sobie ze słuchaniem użytkownika. Jednak w jednej części obrazu znajdują się pewne błędy. Powiedz więc sztucznej inteligencji, że chcesz uzyskać tylko jeden lub dwa znaki, aby ograniczyć szansę wystąpienia takiej sytuacji. Tego typu problemy zdają się pojawiać także przy mniejszym rozmiarze tekstu, więc miej to na uwadze.
Nowoczesny obraz budynku stworzony w DALL-E
5. Użyj narzędzi do korygowania błędów w tekście
Podobnie, w jaki sposób usuwasz wady ze zdjęć zrobionych aparatem, możesz wypróbować narzędzie, które pomaga korygować błędy tekstowe na zdjęciach. Istnieje wiele aplikacji, które naprawiają bełkot na zdjęciach generowanych przez sztuczną inteligencję, np. Storia Lab.
Błąd narzędzia Storia Lab AI Textify
Korzystając z tych narzędzi, zazwyczaj można zaznaczyć tekst i zmienić jego treść w zależności od potrzeb. Niektóre aplikacje są bezpłatne, ale w innych przypadkach konieczna będzie płatna subskrypcja. Jeśli tworzysz wiele obrazów z wykorzystaniem sztucznej inteligencji, możesz kupić miesięczny lub roczny plan, aby uzyskać do nich dostęp, kiedy tylko potrzebujesz.
6. Użyj narzędzi AI do generowania dokładnego tekstu
Być może słyszałeś o Midjourney , DALL-E, Firefly i podobnych generatorach obrazów opartych na sztucznej inteligencji. Ale czy wiesz, że istnieją specjalne generatory grafiki oparte na sztucznej inteligencji, które generują dokładny tekst na obrazach?
Ponieważ jedną ze specjalnych funkcji Ideogramu jest tworzenie czytelnego tekstu, możesz śmiało wypróbować tę aplikację do swoich projektów. Ideogram ma funkcję Magic Prompt, która rozszerza oryginalną funkcję, dzięki czemu możesz uzyskać jeszcze dokładniejsze wyniki. Oprócz planu bezpłatnego dostępne są również płatne plany subskrypcji, których cena zaczyna się od 8 USD miesięcznie.
Mimo że sztuczna inteligencja ma pewne braki w tworzeniu obrazów z czytelnym tekstem, jeśli jesteś w stanie myśleć nieszablonowo, znajdziesz kilka alternatyw. Czasami najlepszym rozwiązaniem jest podanie narzędziu szczegółowych, mniej skomplikowanych podpowiedzi. Możesz również naprawić błędy w obrazach za pomocą innego oprogramowania lub skorzystać z narzędzi zaprojektowanych specjalnie z myślą o tworzeniu dokładnego tekstu.