Home
» Jak
»
Google Labs wydaje Whisk: narzędzie umożliwiające przesyłanie obrazów jako instrukcji zamiast komunikatów tekstowych
Google Labs wydaje Whisk: narzędzie umożliwiające przesyłanie obrazów jako instrukcji zamiast komunikatów tekstowych
Narzędzia do generowania obrazów oparte na sztucznej inteligencji cieszą nas od lat, dzięki takim rozwiązaniom jak OpenAI, Imagen, Adobe Firefly, DALL-E-3 itp. Wraz z rozwojem technologii mamy coraz więcej opcji udoskonalania wyników. Teraz Google Labs udostępniło Whisk, narzędzie umożliwiające przesyłanie obrazów w formie instrukcji zamiast komunikatów tekstowych.
Whisk firmy Google Labs tworzy obrazy z innych obrazów
Jeśli mieszkasz w USA, będziesz mieć teraz dostęp do Whisk w Google Labs, „eksperymentu z zakresu generatywnej sztucznej inteligencji” – jak podaje blog Google. Dzięki Whisk, zamiast opierać się wyłącznie na opisowych wskazówkach tekstowych, możesz dodawać obrazy jako odniesienia. Platforma będzie spełniać 3 główne wymagania: motyw, scena i styl. Następnie narzędzie połączy te elementy i stworzy idealny obraz.
Uwaga : Whisk wykorzystuje Imagen 3, najnowszy model generowania obrazu firmy Google.
Google nie wyeliminowało jeszcze całkowicie komunikatów tekstowych w Whisk. Nadal masz możliwość napisania monitu o utworzenie obrazu dla każdej z 3 kategorii lub dodania ogólnej notatki. Możesz również dostosować obraz po obejrzeniu pierwszego testu Whisk. Załóżmy na przykład, że tworzysz kartkę okolicznościową w stylu vintage, przedstawiającą kota leżącego na śniegu. Po zobaczeniu efektów możesz wpaść na pomysł, aby dodać płatki śniegu jako wykończenie.
Za każdym razem, gdy dodajesz lub tworzysz obraz w dowolnej z 3 kategorii Whisk, platforma generuje szczegółowy opis tekstowy tego obrazu. Jeśli więc chcesz dodać lub edytować istniejący obraz, możesz po prostu dostosować tekst.
Dialog tekstowy na platformie do generowania obrazów AI Whisk umożliwia automatyczną edycję komunikatów tekstowych
Jeśli brakuje Ci inspiracji, możesz zrandomizować elementy wizualne, wybierając ikonę kostki do gry. W przypadku bardziej złożonych projektów możesz również dodać więcej niż jeden motyw, scenę lub odniesienie do stylu.
Gdy już będziesz zadowolony ze swojego dzieła, możesz je zapisać na platformie lub pobrać i mieć do niego dostęp lokalny.
Czy warto używać Whisk?
Mając na uwadze wszystkie zaawansowane opcje przetwarzania obrazu oparte na sztucznej inteligencji, które pozwalają udoskonalać zdjęcia lub tworzyć „oryginalne” dzieła sztuki, nowe narzędzie Google’a może wydawać się sztuczką. Jednak sposób, w jaki Whisk wykorzystuje odniesienia wizualne w procesie tworzenia wizerunku, jest wyjątkowy i widać, jak cenne może to być w sytuacjach kreatywnych i zawodowych.
Załóżmy, że pracujesz nad prezentacją firmy i potrzebujesz obrazów, które będą podobne do tych, które już posiadasz. Zamiast próbować odtworzyć to odniesienie ustnie, po prostu prześlij plik wraz z krótkim opisem tego, jak chcesz, aby wyglądał nowy obraz.
Aby odróżnić Whisk od innych istniejących programów do obrazowania opartych na sztucznej inteligencji, Google jasno zaznaczyło, że platforma jest przeznaczona do odkrywania, a nie udoskonalania. Choć inne produkty mogą być lepiej przystosowane do precyzyjnego dostrajania, Whisk najlepiej nadaje się do burzy mózgów:
„Stworzyliśmy go do szybkiej eksploracji wizualnej, a nie do edycji z dokładnością do pikseli. Whisk to eksploracja pomysłów w nowy i kreatywny sposób, pozwalająca bawić się dziesiątkami opcji i pobierać ulubione”.
Szczerze mówiąc, czasami trudno jest ubrać coś w słowa. Whisk oferuje nowe możliwości, jeśli po prostu „chcesz, żeby obraz wyglądał tak”.