Google ogłasza Android XR, nową platformę OS dla okularów AR i VR
Po latach zaniedbań Google w końcu zdecydowało się skoncentrować swoje inwestycje na urządzeniach rozszerzonej rzeczywistości (XR), takich jak zestawy słuchawkowe i okulary.
Google właśnie zaprezentowało Gemini 2.5, który firma nazywa „najmądrzejszym jak dotąd modelem AI”. Pierwszą wersją tego modelu była Gemini 2.5 Pro, która osiągnęła imponujące wyniki w wielu testach.
Google twierdzi, że Gemini 2.5 przewyższa najlepsze modele od OpenAI, DeepSeek i innych gigantów technologii AI
Gemini 2.5 Pro jest już dostępny w Google AI Studio oraz w aplikacji Gemini, jeśli jesteś użytkownikiem Gemini Advanced . Gemini 2.5 Pro będzie wkrótce dostępny również za pośrednictwem Vertex AI.
Google nie podało na razie cen Gemini 2.5 Pro ani innych modeli Gemini 2.5.
Wszystkie modele wykorzystujące Gemini 2.5 są „modelami myślącymi”, co oznacza, że potrafią przetwarzać proces myślowy przed wygenerowaniem odpowiedzi. Tego typu „rozumujące” modele stanowią kolejny wielki krok w dziedzinie sztucznej inteligencji, ponieważ generują bardziej złożone i często dokładniejsze odpowiedzi.
„Dzięki Gemini 2.5 osiągnęliśmy nowy poziom wydajności, łącząc znacząco ulepszony model bazowy z ulepszonym efektem końcowym ” — oświadczył Google.
„W przyszłości będziemy wbudowywać te możliwości myślenia bezpośrednio we wszystkie nasze modele, dzięki czemu będą mogły one radzić sobie z bardziej złożonymi problemami i wspierać agentów dzięki jeszcze lepszej świadomości kontekstu ” .
Jak Gemini 2.5 wypada w porównaniu z modelami OpenAI?
Modele Gemini 2.5 Pro firmy Google przewyższają poprzednie najlepsze modele OpenAI i DeepSeek.
Wyniki testów Gemini 2.5 udostępnione przez Google są naprawdę imponujące. Gemini 2.5 Pro Experimental uzyskał wynik 18,5% w ostatnim egzaminie Humanity's.
Wynik ten oznacza, że przynajmniej na razie Gemini 2.5 Pro Experimental jest najlepszym modelem pod tym względem. Jego wynik przewyższa wyniki OpenAI 03-mini (14%) i DeepSeek R1 (8,6%).
Ten konkretny test jest uważany za trudny, choć nie jest to jedyny sposób pomiaru wydajności modelu AI.
Google podkreśliło także możliwości programowania Gemini 2.5 Pro oraz osiągnięcia tego modelu w zakresie matematyki i nauk ścisłych. Gemini 2.5 Pro obecnie przoduje w testach porównawczych z zakresu matematyki i nauk ścisłych, mierzonych za pomocą GPQA i AIME 2025.
Czy można programować w Gemini 2.5?
Głównym celem Gemini 2.5 jest programowanie. Google twierdzi, że nastąpił „ogromny krok naprzód w porównaniu z wersją 2.0” i zapowiada, że wkrótce zostaną wprowadzone kolejne usprawnienia.
Nowy model Google'a umożliwia tworzenie aplikacji internetowych i aplikacji opartych na kodzie agentowym. Demo od Google pokazuje, jak za pomocą Gemini 2.5 Pro można stworzyć grę na podstawie jednego wiersza poleceń.
4 powody, dla których Gemini 2.5 Pro firmy Google ma znaczenie dla sztucznej inteligencji przedsiębiorstw
Oto cztery kluczowe kwestie, które zespoły korporacyjne powinny wziąć pod uwagę, oceniając Gemini 2.5 Pro.
1. Ustrukturyzowane, przejrzyste rozumowanie – nowy standard jasności myślenia
Cechą wyróżniającą Gemini 2.5 Pro jest nie tylko inteligencja, ale także sposób, w jaki ta inteligencja wyraźnie pokazuje, jak działa. Metoda szkolenia krok po kroku opracowana przez Google tworzy uporządkowany tok myślenia (CoT), który nie przypomina bełkotu ani zgadywania, jakie widzieliśmy w przypadku takich modeli jak DeepSeek . CoT nie są skrócone do powierzchownych podsumowań, jak modele OpenAI. Nowy model Gemini prezentuje pomysły w ponumerowanych krokach, z podpunktami i niezwykle jasną i transparentną logiką wewnętrzną.
W praktyce oznacza to przełom w niezawodności i żeglowności. Użytkownicy biznesowi oceniający wyniki zadań o znaczeniu krytycznym, takich jak przeglądanie skutków polityki, kodowanie logiki czy podsumowywanie złożonych badań, mogą teraz zobaczyć, w jaki sposób model doprowadził do odpowiedzi. Oznacza to, że mogą weryfikować, poprawiać lub przekierowywać odpowiedzi z większą pewnością. To duży krok naprzód w stosunku do koncepcji „czarnej skrzynki”, która nadal występuje w wielu wynikach dużych modeli językowych (LLM) .
Aby uzyskać bardziej szczegółowe informacje na temat osiągów tego modelu, obejrzyj nagranie wideo, na którym Gemini 2.5 Pro jest testowany na żywo. Oto jeden z przykładów: Kiedy zapytano Gemini 2.5 Pro o ograniczenia dużych modeli językowych, wykazał się on niezwykłą świadomością. Opisuje typowe słabości i klasyfikuje je w obszarach takich jak „intuicja fizyczna”, „synteza nowych koncepcji”, „planowanie długoterminowe” i „niuanse etyczne”, zapewniając ramy, które pomagają użytkownikom zrozumieć, co model wie i jak podejść do problemu.
Zespoły inżynierów przedsiębiorstw mogą wykorzystać tę możliwość do:
Jednym z istotnych ograniczeń jest to, że chociaż takie uporządkowane rozumowanie jest dostępne w aplikacji Gemini i Google AI Studio, to obecnie nie można do niego uzyskać dostępu za pośrednictwem interfejsu API — jest to niedociągnięcie dla deweloperów chcących zintegrować tę możliwość z aplikacjami korporacyjnymi.
2. Prawdziwy pretendent do najnowocześniejszej technologii – nie tylko w teorii
Model ten obecnie zajmuje czołowe miejsca w rankingu Chatbot Arena ze znaczną przewagą – wyprzedza o ponad 35 punktów ELO kolejny najlepszy model, w tym aktualizację OpenAI 4o wprowadzoną dzień po premierze Gemini 2.5 Pro. Choć dominacja w testach porównawczych jest często ulotna (ponieważ nowe modele pojawiają się co tydzień), Gemini 2.5 Pro naprawdę sprawia wrażenie innego.
Sprawdza się znakomicie w zadaniach wymagających głębokiego rozumowania: kodowaniu, rozwiązywaniu niuansów problemów, podsumowywaniu dokumentów, a nawet abstrakcyjnym planowaniu. W testach wewnętrznych program wypadł szczególnie dobrze w trudnych wcześniej testach porównawczych, takich jak „Ostatni egzamin ludzkości”, popularny test służący do wykrywania słabości LLM w obszarach abstrakcyjnych i niuansowych.
Grupy biznesowe mogą nie zwracać uwagi na to, który model wygra w danym rankingu akademickim. Ale będzie ich interesować, czy ten model potrafi myśleć – i pokażą ci, jak myśli. Test wibracyjny jest bardzo ważny.
Jak zauważył szanowany inżynier AI Nathan Lambert, „Google znów ma najlepsze modele, ponieważ to oni powinni byli rozpocząć cały ten boom AI. Wielki błąd został naprawiony”. Użytkownicy biznesowi powinni postrzegać to nie tylko jako próbę dogonienia przez Google konkurencji, ale także jako potencjalną szansę prześcignięcia jej w zakresie funkcji ważnych dla aplikacji biznesowych.
3. Na koniec, gra Google w szyfrowanie jest silna
Tradycyjnie Google pozostawało w tyle za OpenAI i Anthropic pod względem wsparcia kodowania ukierunkowanego na programistów. Gemini 2.5 Pro to zmienia.
W testach praktycznych wykazał on silne zdolności do rozwiązywania problemów z kodowaniem, w tym zbudowania działającej gry Tetris, która uruchomiła się od pierwszej próby po wyeksportowaniu do Replit — bez konieczności debugowania. Co jeszcze bardziej niezwykłe, w książce wyraźnie wyjaśniono strukturę kodu, w przemyślany sposób oznaczono zmienne i kroki oraz przedstawiono podejście, zanim jeszcze napisano choćby jedną linijkę kodu.
Model ten konkuruje z modelem Claude 3.7 Sonnet firmy Anthropic, który jest uważany za lidera w dziedzinie generowania kodu i jest jednym z głównych powodów sukcesu firmy Anthropic na rynku. Jednak Gemini 2.5 oferuje jedną ważną zaletę: ogromne okno kontekstowe tokenów, obejmujące nawet 1 milion osób. Claude 3.7 Sonnet oferuje obecnie tylko 500 000 tokenów.
To duże okno kontekstowe otwiera nowe możliwości wnioskowania na podstawie całej bazy kodu, czytania dokumentacji online i pracy na wielu współzależnych plikach. Doświadczenie inżyniera oprogramowania Simona Willisona pokazuje tę zaletę.
Podczas wdrażania nowej funkcji w naszej bazie kodu za pomocą Gemini 2.5 Pro model zidentyfikował niezbędne zmiany w 18 różnych plikach i ukończył cały projekt w około 45 minut, średnio mniej niż 3 minuty na zmodyfikowany plik. To poważne narzędzie dla firm eksperymentujących z frameworkami agentowymi lub środowiskami programistycznymi opartymi na sztucznej inteligencji.
4. Integracja wielu metod z zachowaniem agenta
Podczas gdy niektóre modele, takie jak najnowszy model 4o firmy OpenAI, mogą wyróżniać się większą liczbą elementów i przyciągać wzrok generowaniem obrazów, Gemini 2.5 Pro sprawia wrażenie, jakby po cichu redefiniował koncepcję ugruntowanego rozumowania multimodalnego.
W jednym z przykładów praktyczny eksperyment przeprowadzony przez Bena Dickson dla VentureBeat pokazał, że model ten potrafi wyodrębnić kluczowe informacje z opracowania technicznego na temat algorytmów wyszukiwania i wygenerować odpowiadający im diagram przepływu w formacie SVG — a następnie udoskonalić ten diagram przepływu, wyświetlając mu wyrenderowaną wersję z błędami wizualnymi. Ten poziom rozumowania multimodalnego pozwala na tworzenie nowych przepływów pracy, które wcześniej nie były możliwe w przypadku modeli opartych wyłącznie na tekście.
W innym przykładzie programista Sam Witteveen przesłał prosty zrzut ekranu mapy Las Vegas i zapytał, jakie wydarzenia Google odbywają się w pobliżu 9 kwietnia. Model zidentyfikował lokalizację, wywnioskował intencję użytkownika, przeszukał Internet i zwrócił dokładne szczegóły dotyczące Google Cloud Next, w tym datę, lokalizację i cytowanie. Wszystko to odbywa się bez konieczności użycia niestandardowego frameworka agenta, przy użyciu tylko podstawowego modelu i wbudowanej funkcji wyszukiwania.
W rzeczywistości ten multimodalny model wnioskowania na podstawie danych wejściowych wykracza poza samo patrzenie na niego. Sugeruje, jak może wyglądać przepływ pracy w firmie za 6 miesięcy: Prześlij dokumenty, diagramy i pulpity nawigacyjne, a następnie pozwól modelowi na syntezę, planowanie lub podejmowanie znaczących działań na podstawie treści.
Po latach zaniedbań Google w końcu zdecydowało się skoncentrować swoje inwestycje na urządzeniach rozszerzonej rzeczywistości (XR), takich jak zestawy słuchawkowe i okulary.
Choć nie jest tak szeroko omawiany jak niektóre konkurencyjne rozwiązania, Gemini AI od Google'a ma wiele zalet. Oto pięć powodów, dla których Gemini zasługuje na Twoją uwagę.
Choć producentów urządzeń z Androidem jest wielu, nie wszyscy zwracają uwagę na aktualizacje oprogramowania. Mimo że sytuacja ta poprawiła się w ciągu ostatniej dekady, nie wszyscy producenci smartfonów zapewniają doskonałe wsparcie programowe.
Ostatnio niektórzy użytkownicy zauważyli, że Google Gemini w niektórych odpowiedziach zwraca powtarzający się tekst, dziwne znaki i kompletne bzdury.
Aplikacja Google na iPhone'a wkrótce stanie się nieco mniej użyteczna, ponieważ Google niedawno usunęło z niej dostęp do Gemini AI.
Utrata dostępu do konta Google może mieć poważne konsekwencje wykraczające poza możliwość wysyłania i odbierania wiadomości e-mail.
Firma Google właśnie ogłosiła, że użytkownicy mogą teraz tworzyć filmy za pomocą sztucznej inteligencji za pośrednictwem swojego chatbota Gemini i niedawno uruchomionego eksperymentalnego narzędzia Whisk.
Niezależnie od tego, czy dopiero stawiasz pierwsze kroki na rynku pracy, czy przechodzisz do nowej branży, eksperymentalna usługa Career Dreamer od Google ma na celu połączenie Cię z odpowiednimi stanowiskami.
W zeszłym roku Google wprowadziło w wyszukiwarce asystenta zakupów opartego na sztucznej inteligencji, który pozwala użytkownikom uzyskać wizualny obraz tego, jak dany element garderoby będzie wyglądał na konkretnym typie sylwetki.
Google coraz bardziej interesuje się zastosowaniem sztucznej inteligencji w medycynie.
Po kilku dniach zamieszania Google oficjalnie potwierdziło problem zarówno z Chromecastem drugiej generacji, jak i Chromecastem Audio.
W poniedziałek wyciekły wewnętrzne dokumenty opisujące czynniki, jakie wyszukiwarka Google bierze pod uwagę przy ustalaniu rankingu i wyświetlaniu wyników wyszukiwania w sieci.
Google stopniowo wycofuje starą technologię rozpoznawania głosu i zastępuje ją wirtualnym asystentem.
Firma Samsung Electronics ogłosiła plany zintegrowania Eclipsa Audio, zupełnie nowej technologii dźwięku 3D, opracowanej we współpracy z Google, z ofertą telewizorów i soundbarów na rok 2025.
Google ogłosiło dziś sześć nowych funkcji, które pojawią się w smartfonach z systemem Android.
Stworzenie zdrowej relacji z technologią może wydawać się trudne, ale małe zmiany często czynią dużą różnicę.
Aplikacja Galeria firmy Samsung ma większe możliwości niż mogłoby się wydawać, ale może się to nie wydawać oczywiste.
Mówi się, że Microsoft jest coraz bliżej wypuszczenia na rynek swojego pierwszego składanego smartfona, gdy 1 października uzyskał patent na składany telefon z możliwością złożenia o 360 stopni, który nie powoduje powstawania zagnieceń na ekranie.
Google testuje nową funkcję weryfikacji za pomocą niebieskiego znacznika wyboru w wyszukiwarce. Funkcja ta pomoże użytkownikom unikać klikania na fałszywe lub oszukańcze linki do witryn internetowych.
Na pierwszy rzut oka Microsoft 365 i Office 2024 mogą wydawać się bardzo podobne, ponieważ oba zapewniają dostęp do popularnych i szeroko wykorzystywanych aplikacji firmy Microsoft.
Kody Elemental Dungeons są niezbędną formą nagrody dla graczy. Podobnie jak w przypadku każdej innej gry online w Robloxie, gracze mogą otrzymywać te asysty w zamian za pieniądze lub inne przedmioty.
Podczas drukowania dokumentu Word utwórz w nim tabelę. Powtórzenie tytułu w programie Word ułatwia jego śledzenie oraz pozwala na płynne odczytywanie tytułu dokumentu na różnych stronach, zwłaszcza w przypadku długich tytułów.
Nowa aplikacja iMessage w systemie iOS 18 została wzbogacona o animowane wiadomości, efekty tekstowe i wiele opcji do wykorzystania w wysyłanych wiadomościach.
Istnieje ciekawy fakt na temat świń, o którym nie wszyscy wiedzą: świnie są uważane za wrogów węży, ponieważ gdy te dwa zwierzęta się spotkają, większość węży stanie się pożywieniem dla świń.
Jaka jest odległość od Ziemi do Jowisza? Jeśli nie wiesz, ten artykuł dowiesz się, jak daleko Jowisz znajduje się od Ziemi.
Którzy generałowie nie są uwzględnieni w meta-grze Mobile Alliance? Przyjrzyjmy się teraz
Graves DTCL z sezonów 1, 3 i 6 kosztuje tylko 1 sztukę złota i wydaje się być po prostu dodatkowym bohaterem mającym na celu pobudzenie klanu; główna rola we wczesnej fazie gry jest nadal wykorzystywana, ale nie w zbyt dużym stopniu. Od sezonu 7.5 DTCL cena Gravesa gwałtownie wzrosła do 4 sztuk złota i zdecydowanie jest niezastąpionym wyborem, jeśli zdecydujesz się grać Thunder Dragonem lub Gunnerem.
W przypadku telefonów Samsung należy korzystać z osobnej aplikacji obsługującej dźwięki. Możesz na przykład słuchać muzyki z Apple Music, a telefon będzie odtwarzał dźwięk przez głośniki samochodu.
W Internecie można znaleźć wiele dobrych statusów dotyczących pracy. W tym artykule podsumujemy dobre i wartościowe statusy zawodowe.
Jaki jest dobry i pełen znaczenia podpis pod rocznicą ślubu? W tym artykule znajdziesz krótkie, zwięzłe podpisy pod rocznicami, które sprawią, że Twój partner zapamięta je na zawsze.