Jak podaje VentureBeat, Google wydało najnowszą wersję Imagen 3, narzędzia opartego na sztucznej inteligencji do zamiany obrazów na tekst. Obecnie jest ono dostępne wyłącznie dla użytkowników w USA. Narzędzie, do którego można uzyskać dostęp za pośrednictwem AI Test Kitchen firmy Google, ma tworzyć obrazy o „większej szczegółowości, bogatszych kolorach, lepszym oświetleniu i mniejszej liczbie elementów rozpraszających uwagę” niż poprzednie modele AI firmy Google.

Firma Google po raz pierwszy zapowiedziała udoskonaloną wersję narzędzia Imagen 3 na swoim wydarzeniu I/O w maju, ale szeroko udostępniono ją dopiero w ciągu ostatnich kilku dni za pośrednictwem platformy Google Vertex AI. Niektórzy użytkownicy Reddita zaczęli eksperymentować z Imagen 3 w zeszłym tygodniu, a we wtorek Google opublikowało artykuł badawczy na temat tego narzędzia.
Podobnie jak inne generatory obrazów oparte na sztucznej inteligencji, Imagen 3 może generować szczegółowe obrazy na podstawie żądanego tekstu. Możesz również edytować obraz, zaznaczając konkretną część i opisując, co chcesz zmienić.
Mimo że jest to zaawansowana sztuczna inteligencja generująca obrazy, narzędzie to nadal podlega pewnym zasadom bezpieczeństwa. Przykładowo, narzędzie to odmawia generowania obrazów gwiazd, takich jak Lady Gaga, ani obrazów broni. I choć proces zatrzyma się przed wygenerowaniem nazwanych znaków, nadal możesz tworzyć szczegółowe obrazy, opisując postać, którą chcesz stworzyć.

Za pomocą tego narzędzia można tworzyć obrazy kultowych postaci, takich jak Mario, Sonic, Pikachu... a mój kolega może tworzyć postacie przypominające Myszkę Miki. Zauważyłem również, że program potrafi generować loga takich firm jak Apple, Macy's, Hershey's, a nawet Google, co można zobaczyć na obrazku na górze artykułu.
Pomimo stosunkowo elastycznych przepisów bezpieczeństwa, Imagen 3 nadal ostro kontrastuje z Grokiem, narzędziem do obrazowania AI na platformie X Elona Muska. Grok był używany do tworzenia dość „dzikich” treści, w tym obrazów przedstawiających narkotyki, przemoc i gwiazdy.
Narzędzia sztucznej inteligencji Google'a mają jednak pewne wady. Na początku tego roku Google przestało pozwalać użytkownikom na tworzenie obrazów za pomocą swojego chatbota Gemini AI po tym, jak użytkownicy odkryli, że generuje on historycznie niedokładne obrazy.