OpenAI ogłasza GPT-4.1 — najinteligentniejszy model do złożonych zadań

Firma OpenAI oficjalnie zaprezentowała trzy nowe modele: GPT-4.1, GPT-4.1 mini i GPT-4.1 nano. Modele te oferują ogromne możliwości przetwarzania kontekstu, sięgające nawet 1 miliona tokenów, oraz limity wiedzy aktualizowane do czerwca 2024 r.

Firma twierdzi, że modele te oferują lepsze wyniki niż ostatnio ulepszone modele GPT-4o i GPT-4o mini, które wprowadzono na rynek w lipcu ubiegłego roku. Obecnie standard GPT-4.1 jest dostępny tylko za pośrednictwem interfejsu API, dlatego nie będzie można go jeszcze używać bezpośrednio w ChatGPT.

OpenAI zaznacza, że ​​GPT-4.1 będzie dostępny wyłącznie poprzez API. W ChatGPT wiele udoskonaleń w zakresie zgodności instrukcji, programowania i inteligencji zostało stopniowo zintegrowanych z najnowszą wersją GPT-4o, a firma będzie nadal dodawać kolejne w przyszłych wydaniach.

OpenAI ogłasza GPT-4.1 — najinteligentniejszy model do złożonych zadań

Testy porównawcze pokazują znaczące udoskonalenia wprowadzane przez GPT-4.1. Model ten uzyskał wynik 54,6% w teście SWE-bench Verified, co stanowi wzrost o 21,4 punktu w stosunku do GPT-4o. Model uzyskał wynik 38,3% w teście MultiChallenge — ocenie mierzącej przestrzeganie wytycznych — i ustanowił nowy rekord w zakresie rozumienia długich filmów, uzyskując wynik 72,0% w teście Video-MME, w którym modele analizują filmy trwające do godziny bez napisów.

OpenAI nawiązało również współpracę z partnerami alfa w celu przetestowania wydajności GPT-4.1 w rzeczywistych zastosowaniach.

  • Thomson Reuters przetestował GPT-4.1 przy pomocy swojego asystenta prawnego CoCounsel, opartego na sztucznej inteligencji. W porównaniu z GPT-4o, GPT-4.1 odnotowuje 17% wzrost dokładności przy ocenie wielu dokumentów. Tego typu praca opiera się w dużej mierze na możliwości śledzenia kontekstu w wielu źródłach i identyfikowania złożonych powiązań, takich jak sprzeczne terminy lub ukryte zależności, a GPT-4.1 niezmiennie wykazuje wysoką wydajność.
  • Carlyle użył GPT-4.1 do wyodrębnienia danych finansowych z długich i złożonych dokumentów, w tym plików Excel i PDF. Według wewnętrznych testów firmy, model ten działa o 50% lepiej niż poprzednie modele przy wyszukiwaniu dokumentów. Jest to pierwszy model, który niezawodnie radzi sobie z takimi problemami, jak szukanie „igły w stogu siana”, gubienie informacji w środku dokumentu i argumenty wymagające łączenia informacji w wielu plikach.

Wydajność to jedno, ale równie ważna jest szybkość. Według OpenAI GPT-4.1 zwraca pierwszy token w ciągu około 15 sekund przy przetworzeniu 128 000 tokenów, a w przypadku przetworzenia pełnego miliona tokenów – nawet w ciągu 30 sekund. GPT-4.1 mini i nano są jeszcze szybsze.

GPT-4.1 nano zazwyczaj odpowiada w czasie krótszym niż 5 sekund na monity zawierające 128 000 tokenów wejściowych. Szybkie buforowanie może dodatkowo zmniejszyć opóźnienia i obniżyć koszty.

Znaczący postęp nastąpił także w rozumieniu obrazu. W szczególności GPT-4.1 mini przewyższa GPT-4o w różnych testach wydajności wizualnej.

  • W teście MMMU (obejmującym wykresy, diagramy i mapy) GPT-4.1 mini uzyskał wynik 73%. Jest to wynik wyższy niż GPT-4.5 i znacznie przewyższający 56% GPT-4o mini.
  • W programie MathVista (który testuje zdolność rozwiązywania problemów z obrazami) zarówno GPT-4.1, jak i GPT-4.1 mini uzyskały 57%, co znacznie przewyższa wynik GPT-4o mini, który wyniósł 37%.
  • W CharXiv-Reasoning , gdzie modele odpowiadają na pytania w oparciu o wykresy naukowe, GPT-4.1 nadal przoduje.
  • W przypadku Video-MME (długie filmy bez napisów) GPT-4.1 osiągnął wynik 72%, co stanowi znaczną poprawę w porównaniu z wynikiem GPT-4o, który wyniósł 65%.

O cenie:

  • GPT-4.1 kosztuje 2 dolary za 1 milion tokenów wejściowych i 8 dolarów za milion tokenów wyjściowych.
  • Cena modułu GPT-4.1 mini wynosi 0,40 USD za wejście i 1,60 USD za wyjście.
  • Koszt wejścia GPT-4.1 nano wynosi 0,10 USD, a wyjścia 0,40 USD.

Koszty te można dodatkowo obniżyć, korzystając z buforowania natychmiastowego lub interfejsu API wsadowego, co jest przydatne w przypadku aplikacji na dużą skalę. Firma OpenAI przygotowuje się również do zakończenia obsługi standardu GPT-4.5 Preview w dniu 14 lipca 2025 r., powołując się na lepszą wydajność, mniejsze opóźnienia i niższe koszty standardu GPT-4.1.

Sign up and earn $1000 a day ⋙

Leave a Comment

Alibaba prezentuje QwQ-32b, godnego konkurenta DeepSeek

Alibaba prezentuje QwQ-32b, godnego konkurenta DeepSeek

Czy obietnice Alibaby okażą się prawdziwe, pozostaje niewiadome, ale wygląda na to, że ChatGPT i DeepSeek mają teraz nowego, godnego konkurenta.

OpenAI rzuca wyzwanie Google Chrome dzięki swojej nowej przeglądarce

OpenAI rzuca wyzwanie Google Chrome dzięki swojej nowej przeglądarce

Według doniesień firma OpenAI pracuje nad projektem przeglądarki internetowej, która ma potencjał, aby bezpośrednio konkurować z przeglądarką Google Chrome.

Samsung współpracuje z OpenAI w celu opracowania telewizora AI, obiecując wiele interesujących funkcji

Samsung współpracuje z OpenAI w celu opracowania telewizora AI, obiecując wiele interesujących funkcji

Według doniesień Samsung Electronics współpracuje z OpenAI przy ambitnym wspólnym projekcie mającym na celu opracowanie telewizorów AI, które będą zawierać wiodące w branży technologie sztucznej inteligencji.

Microsoft będzie nadal inwestować w OpenAI, którego wycena wyniesie ponad 100 miliardów dolarów

Microsoft będzie nadal inwestować w OpenAI, którego wycena wyniesie ponad 100 miliardów dolarów

Od 2019 r. firma Microsoft zainwestowała miliardy dolarów w OpenAI, choć gigant oprogramowania z siedzibą w Redmond nie jest w żadnym wypadku głównym inwestorem w tym innowacyjnym startupie zajmującym się sztuczną inteligencją.

OpenAI ma zamiar przejąć Windsurf – jeden z najpotężniejszych na świecie edytorów kodu AI

OpenAI ma zamiar przejąć Windsurf – jeden z najpotężniejszych na świecie edytorów kodu AI

OpenAI prowadzi rozmowy w sprawie przejęcia Windsurf, wiodącego w branży edytora kodu opartego na sztucznej inteligencji.

O1-pro to jak dotąd najdroższy model AI firmy OpenAI

O1-pro to jak dotąd najdroższy model AI firmy OpenAI

Firma OpenAI udostępniła w swoim interfejsie API dla programistów bardziej zaawansowaną wersję swojego modelu sztucznej inteligencji o1 – o1-pro.

OpenAI ogłasza plan ChatGPT Pro za oszałamiające 200 USD miesięcznie

OpenAI ogłasza plan ChatGPT Pro za oszałamiające 200 USD miesięcznie

OpenAI oferuje obecnie cztery poziomy subskrypcji ChatGPT, aby sprostać potrzebom różnych grup klientów.

OpenAI wprowadza projekty ChatGPT: nowe funkcje umożliwiające inteligentniejszą organizację konwersacji

OpenAI wprowadza projekty ChatGPT: nowe funkcje umożliwiające inteligentniejszą organizację konwersacji

Tworząc projekt, użytkownicy mogą przechowywać rozmowy, pliki i instrukcje dotyczące dostosowywania w jednym miejscu. Dzięki temu mogą łatwo powrócić do tego, co robili wcześniej.

OpenAI ogłasza inicjatywę mającą na celu opracowanie standardów AI dla branż

OpenAI ogłasza inicjatywę mającą na celu opracowanie standardów AI dla branż

OpenAI właśnie ogłosiło Program Pionierów – inicjatywę mającą na celu promowanie zastosowań sztucznej inteligencji w sytuacjach z życia wziętych.

Softbank planuje prześcignąć Microsoft i zostać największym inwestorem OpenAI

Softbank planuje prześcignąć Microsoft i zostać największym inwestorem OpenAI

Japoński gigant inwestycyjny Softbank planuje zainwestować od 15 do 25 miliardów dolarów w OpenAI. Jeśli transakcja dojdzie do skutku, Softbank zostanie największym inwestorem OpenAI, zastępując firmę Microsoft, która obecnie zajmuje tę pozycję.

Użytkownicy mogą rozmawiać z Mikołajem, korzystając z trybu głosowego ChatGPT

Użytkownicy mogą rozmawiać z Mikołajem, korzystając z trybu głosowego ChatGPT

Dzięki ChatGPT będziesz mógł wykonywać swoją pracę lepiej, dając Ci możliwość bezpośredniej rozmowy ze Świętym Mikołajem.

OpenAI wyda w grudniu Oriona, swój kolejny wielki model AI

OpenAI wyda w grudniu Oriona, swój kolejny wielki model AI

Według doniesień The Verge firma OpenAI planuje wprowadzić na rynek w grudniu swój kolejny wiodący model sztucznej inteligencji – Orion.

Alibaba wprowadza model AI, który potrafi odczytywać ludzkie emocje

Alibaba wprowadza model AI, który potrafi odczytywać ludzkie emocje

Chiński gigant e-commerce Alibaba nie przestaje być gwiazdą medialnej prasy za sprawą wprowadzenia na rynek nowego modelu sztucznej inteligencji, który, jak twierdzi firma, potrafi odczytywać ludzkie emocje.

OpenAI uruchamia sklep GPT i zespół ChatGPT, przenosząc ekosystem ChatGPT na wyższy poziom

OpenAI uruchamia sklep GPT i zespół ChatGPT, przenosząc ekosystem ChatGPT na wyższy poziom

Po długim oczekiwaniu i niezliczonych plotkach OpenAI w końcu ogłosiło długo oczekiwane uruchomienie sklepu GPT Store i zespołu ChatGPT.

Składany smartfon Microsoftu nie będzie miał zagięć

Składany smartfon Microsoftu nie będzie miał zagięć

Mówi się, że Microsoft jest coraz bliżej wypuszczenia na rynek swojego pierwszego składanego smartfona, gdy 1 października uzyskał patent na składany telefon z możliwością złożenia o 360 stopni, który nie powoduje powstawania zagnieceń na ekranie.

Google testuje niebieski znacznik wyboru w wyszukiwarce

Google testuje niebieski znacznik wyboru w wyszukiwarce

Google testuje nową funkcję weryfikacji za pomocą niebieskiego znacznika wyboru w wyszukiwarce. Funkcja ta pomoże użytkownikom unikać klikania na fałszywe lub oszukańcze linki do witryn internetowych.

Rozróżnianie Microsoft 365 i Office 2024

Rozróżnianie Microsoft 365 i Office 2024

Na pierwszy rzut oka Microsoft 365 i Office 2024 mogą wydawać się bardzo podobne, ponieważ oba zapewniają dostęp do popularnych i szeroko wykorzystywanych aplikacji firmy Microsoft.

Najnowsze kody do Elemental Dungeons i jak je wprowadzać

Najnowsze kody do Elemental Dungeons i jak je wprowadzać

Kody Elemental Dungeons są niezbędną formą nagrody dla graczy. Podobnie jak w przypadku każdej innej gry online w Robloxie, gracze mogą otrzymywać te asysty w zamian za pieniądze lub inne przedmioty.

Jak powtórzyć pasek tytułu tabeli w programie Word

Jak powtórzyć pasek tytułu tabeli w programie Word

Podczas drukowania dokumentu Word utwórz w nim tabelę. Powtórzenie tytułu w programie Word ułatwia jego śledzenie oraz pozwala na płynne odczytywanie tytułu dokumentu na różnych stronach, zwłaszcza w przypadku długich tytułów.

Jak tworzyć animowane wiadomości w iMessage iOS 18

Jak tworzyć animowane wiadomości w iMessage iOS 18

Nowa aplikacja iMessage w systemie iOS 18 została wzbogacona o animowane wiadomości, efekty tekstowe i wiele opcji do wykorzystania w wysyłanych wiadomościach.

Dlaczego świnie są wrogiem węży?

Dlaczego świnie są wrogiem węży?

Istnieje ciekawy fakt na temat świń, o którym nie wszyscy wiedzą: świnie są uważane za wrogów węży, ponieważ gdy te dwa zwierzęta się spotkają, większość węży stanie się pożywieniem dla świń.

Jaka jest odległość Ziemi od Jowisza – największej planety Układu Słonecznego?

Jaka jest odległość Ziemi od Jowisza – największej planety Układu Słonecznego?

Jaka jest odległość od Ziemi do Jowisza? Jeśli nie wiesz, ten artykuł dowiesz się, jak daleko Jowisz znajduje się od Ziemi.

Odkryj metagenerałów sezonu S1 2023 Lien Quan Mobile

Odkryj metagenerałów sezonu S1 2023 Lien Quan Mobile

Którzy generałowie nie są uwzględnieni w meta-grze Mobile Alliance? Przyjrzyjmy się teraz

Graves DTCL sezon 7.5: standardowe przedmioty, skład Graves Loi Long

Graves DTCL sezon 7.5: standardowe przedmioty, skład Graves Loi Long

Graves DTCL z sezonów 1, 3 i 6 kosztuje tylko 1 sztukę złota i wydaje się być po prostu dodatkowym bohaterem mającym na celu pobudzenie klanu; główna rola we wczesnej fazie gry jest nadal wykorzystywana, ale nie w zbyt dużym stopniu. Od sezonu 7.5 DTCL cena Gravesa gwałtownie wzrosła do 4 sztuk złota i zdecydowanie jest niezastąpionym wyborem, jeśli zdecydujesz się grać Thunder Dragonem lub Gunnerem.

Jak korzystać z oddzielnych dźwięków aplikacji na Samsungu

Jak korzystać z oddzielnych dźwięków aplikacji na Samsungu

W przypadku telefonów Samsung należy korzystać z osobnej aplikacji obsługującej dźwięki. Możesz na przykład słuchać muzyki z Apple Music, a telefon będzie odtwarzał dźwięk przez głośniki samochodu.

Dobre cytaty o pracy, dobre statusy o pracy inspirują Cię do osiągnięcia sukcesu

Dobre cytaty o pracy, dobre statusy o pracy inspirują Cię do osiągnięcia sukcesu

W Internecie można znaleźć wiele dobrych statusów dotyczących pracy. W tym artykule podsumujemy dobre i wartościowe statusy zawodowe.

Podpisy na rocznicę ślubu, znaczące i słodkie statusy na rocznicę ślubu

Podpisy na rocznicę ślubu, znaczące i słodkie statusy na rocznicę ślubu

Jaki jest dobry i pełen znaczenia podpis pod rocznicą ślubu? W tym artykule znajdziesz krótkie, zwięzłe podpisy pod rocznicami, które sprawią, że Twój partner zapamięta je na zawsze.

Lista najnowszych kodów Dai Hiep Phong Van i sposób ich wykorzystania

Lista najnowszych kodów Dai Hiep Phong Van i sposób ich wykorzystania

Code Dai Hiep Phong Van pomaga graczom wykorzystać atrakcyjne nagrody, nawet jeśli dopiero zaczynają poznawać świat gry.

Lista najnowszych kodów Sword of Convallaria i jak je wykorzystać

Lista najnowszych kodów Sword of Convallaria i jak je wykorzystać

Code Sword of Convallaria oferuje graczom szereg nagród, takich jak waluta, punkty doświadczenia, przywoływanie postaci...