Sztuczna inteligencja Alibaby zamienia nieruchome zdjęcia w mowę i śpiew

EMO (Emotive Portrait Alive) to nowa generatywna sztuczna inteligencja, opracowana przez Instytut Inteligentnych Komputerów (IIC) Alibaby, która potrafi „magicznie” przekształcić dowolny obraz w realistyczną mowę i śpiew.

Innymi słowy, sztuczna inteligencja Alibaby potrafi zamienić statyczny obraz i ścieżkę dźwiękową w wideo, które może mówić i śpiewać z naturalną ekspresją.

Poprzednie AI przekształcały jedynie usta i część twarzy, podczas gdy EMO potrafi tworzyć mimikę twarzy, naturalną ekspresję ust, precyzyjną synchronizację ust, poruszać brwiami, marszczyć oczy, a nawet kołysać się w rytm muzyki.

Alibaba opublikowała kilka filmów pokazujących, jak obrazy mogą być zamieniane w filmy, a użytkownicy mogą na bieżąco śpiewać zaimportowane piosenki. EMO obsługuje język angielski, chiński i wiele innych języków.

Alibaba ujawniła, że aby EMO mogło tworzyć realistyczne mimiki twarzy, zostało przeszkolone z wykorzystaniem dużej ilości danych obrazowych, dźwiękowych i wideo za pomocą własnego modelu dyfuzji o nazwie Audio2Video.

Aby sprostać poważnemu obecnie wyzwaniu, jakim jest realizm i ekspresja w generowaniu wideo z obrazów i dźwięków, zespół badawczy skupił się na relacji i niuansach między sygnałami audio a ruchami twarzy, omijając pośrednie powiązania z modelami 3D lub punktami orientacyjnymi twarzy, płynnie zmieniając klatki i zachowując spójność wideo.

Alibaba nie ujawniła, kiedy udostępni tę sztuczną inteligencję opinii publicznej, ale opublikowała dane EMO w serwisie Github i prace badawcze zamieszczone w serwisie ArXiv.

Tags: #emo #emocjonalny portret żywy #kto stworzył życie #kto przekształca obraz może śpiewać

Jak odzyskać dostęp do dysku twardego, naprawić błąd uniemożliwiający otwarcie dysku twardego

W tym artykule pokażemy Ci, jak odzyskać dostęp do dysku twardego w przypadku awarii. Sprawdźmy!

Jak korzystać z funkcji Conversation Awareness i Live Listen na AirPods

Na pierwszy rzut oka AirPodsy wyglądają jak każde inne prawdziwie bezprzewodowe słuchawki douszne. Ale wszystko się zmieniło, gdy odkryto kilka mało znanych funkcji.

Wszystko o iOS 26

Firma Apple wprowadziła system iOS 26 — dużą aktualizację z zupełnie nową obudową ze szkła matowego, inteligentniejszym interfejsem i udoskonaleniami znanych aplikacji.

Najlepsze laptopy dla studentów w 2025 roku

Studenci potrzebują konkretnego typu laptopa do nauki. Powinien być nie tylko wystarczająco wydajny, aby dobrze sprawdzać się na wybranym kierunku, ale także kompaktowy i lekki, aby można go było nosić przy sobie przez cały dzień.

Jak dodać drukarkę do systemu Windows 10

Dodanie drukarki do systemu Windows 10 jest proste, choć proces ten w przypadku urządzeń przewodowych będzie się różnić od procesu w przypadku urządzeń bezprzewodowych.

Jak sprawdzić pamięć RAM i błędy pamięci RAM na komputerze z najwyższą dokładnością

Jak wiadomo, pamięć RAM to bardzo ważny element sprzętowy komputera, który przetwarza dane i jest czynnikiem decydującym o szybkości laptopa lub komputera stacjonarnego. W poniższym artykule WebTech360 przedstawi Ci kilka sposobów sprawdzania błędów pamięci RAM za pomocą oprogramowania w systemie Windows.

Różnica między zwykłym telewizorem a Smart TV

Telewizory Smart TV naprawdę podbiły świat. Dzięki tak wielu świetnym funkcjom i możliwościom połączenia z Internetem technologia zmieniła sposób, w jaki oglądamy telewizję.

Dlaczego zamrażarka nie ma światła, a lodówka tak?

Lodówki to powszechnie stosowane urządzenia gospodarstwa domowego. Lodówki zazwyczaj mają dwie komory: komora chłodna jest pojemna i posiada światło, które włącza się automatycznie po każdym otwarciu lodówki, natomiast komora zamrażarki jest wąska i nie posiada światła.

2 sposoby na naprawę przeciążenia sieci, które spowalnia sieć Wi-Fi

Na działanie sieci Wi-Fi wpływa wiele czynników poza routerami, przepustowością i zakłóceniami. Istnieje jednak kilka sprytnych sposobów na usprawnienie działania sieci.

Jak obniżyć wersję iOS 17 do iOS 16 bez utraty danych za pomocą Tenorshare Reiboot

Jeśli chcesz powrócić do stabilnej wersji iOS 16 na swoim telefonie, poniżej znajdziesz podstawowy przewodnik, jak odinstalować iOS 17 i obniżyć wersję iOS 17 do 16.

Co dzieje się z organizmem, gdy codziennie jesz jogurt?

Jogurt jest wspaniałym produktem spożywczym. Czy warto jeść jogurt codziennie? Jak zmieni się Twoje ciało, gdy będziesz jeść jogurt codziennie? Przekonajmy się razem!

Który rodzaj ryżu jest najlepszy dla zdrowia?

W tym artykule omówiono najbardziej odżywcze rodzaje ryżu i dowiesz się, jak zmaksymalizować korzyści zdrowotne, jakie daje wybrany przez Ciebie rodzaj ryżu.

Jak obudzić się rano na czas

Ustalenie harmonogramu snu i rutyny związanej z kładzeniem się spać, zmiana budzika i dostosowanie diety to niektóre z działań, które mogą pomóc Ci lepiej spać i budzić się rano o odpowiedniej porze.

Wskazówki dotyczące gry Rent Please! Symulator wynajmującego dla nowicjuszy

Proszę o wynajem! Landlord Sim to mobilna gra symulacyjna dostępna na systemy iOS i Android. Wcielisz się w rolę właściciela kompleksu apartamentowego i wynajmiesz mieszkania, a Twoim celem jest odnowienie wnętrz apartamentów i przygotowanie ich na przyjęcie najemców.

Najnowsze kody do obrony wieży łazienkowej i jak je wprowadzać

Zdobądź kod do gry Bathroom Tower Defense Roblox i wymień go na atrakcyjne nagrody. Pomogą ci ulepszyć lub odblokować wieże zadające większe obrażenia.