OpenAI ogłasza GPT-4.1 — najinteligentniejszy model do złożonych zadań

Firma OpenAI oficjalnie zaprezentowała trzy nowe modele: GPT-4.1, GPT-4.1 mini i GPT-4.1 nano. Modele te oferują ogromne możliwości przetwarzania kontekstu, sięgające nawet 1 miliona tokenów, oraz limity wiedzy aktualizowane do czerwca 2024 r.

Firma twierdzi, że modele te oferują lepsze wyniki niż ostatnio ulepszone modele GPT-4o i GPT-4o mini, które wprowadzono na rynek w lipcu ubiegłego roku. Obecnie standard GPT-4.1 jest dostępny tylko za pośrednictwem interfejsu API, dlatego nie będzie można go jeszcze używać bezpośrednio w ChatGPT.

OpenAI zaznacza, że GPT-4.1 będzie dostępny wyłącznie poprzez API. W ChatGPT wiele udoskonaleń w zakresie zgodności instrukcji, programowania i inteligencji zostało stopniowo zintegrowanych z najnowszą wersją GPT-4o, a firma będzie nadal dodawać kolejne w przyszłych wydaniach.

OpenAI ogłasza GPT-4.1 — najinteligentniejszy model do złożonych zadań

Testy porównawcze pokazują znaczące udoskonalenia wprowadzane przez GPT-4.1. Model ten uzyskał wynik 54,6% w teście SWE-bench Verified, co stanowi wzrost o 21,4 punktu w stosunku do GPT-4o. Model uzyskał wynik 38,3% w teście MultiChallenge — ocenie mierzącej przestrzeganie wytycznych — i ustanowił nowy rekord w zakresie rozumienia długich filmów, uzyskując wynik 72,0% w teście Video-MME, w którym modele analizują filmy trwające do godziny bez napisów.

OpenAI nawiązało również współpracę z partnerami alfa w celu przetestowania wydajności GPT-4.1 w rzeczywistych zastosowaniach.

Thomson Reuters przetestował GPT-4.1 przy pomocy swojego asystenta prawnego CoCounsel, opartego na sztucznej inteligencji. W porównaniu z GPT-4o, GPT-4.1 odnotowuje 17% wzrost dokładności przy ocenie wielu dokumentów. Tego typu praca opiera się w dużej mierze na możliwości śledzenia kontekstu w wielu źródłach i identyfikowania złożonych powiązań, takich jak sprzeczne terminy lub ukryte zależności, a GPT-4.1 niezmiennie wykazuje wysoką wydajność.
Carlyle użył GPT-4.1 do wyodrębnienia danych finansowych z długich i złożonych dokumentów, w tym plików Excel i PDF. Według wewnętrznych testów firmy, model ten działa o 50% lepiej niż poprzednie modele przy wyszukiwaniu dokumentów. Jest to pierwszy model, który niezawodnie radzi sobie z takimi problemami, jak szukanie „igły w stogu siana”, gubienie informacji w środku dokumentu i argumenty wymagające łączenia informacji w wielu plikach.

Wydajność to jedno, ale równie ważna jest szybkość. Według OpenAI GPT-4.1 zwraca pierwszy token w ciągu około 15 sekund przy przetworzeniu 128 000 tokenów, a w przypadku przetworzenia pełnego miliona tokenów – nawet w ciągu 30 sekund. GPT-4.1 mini i nano są jeszcze szybsze.

GPT-4.1 nano zazwyczaj odpowiada w czasie krótszym niż 5 sekund na monity zawierające 128 000 tokenów wejściowych. Szybkie buforowanie może dodatkowo zmniejszyć opóźnienia i obniżyć koszty.

Znaczący postęp nastąpił także w rozumieniu obrazu. W szczególności GPT-4.1 mini przewyższa GPT-4o w różnych testach wydajności wizualnej.

W teście MMMU (obejmującym wykresy, diagramy i mapy) GPT-4.1 mini uzyskał wynik 73%. Jest to wynik wyższy niż GPT-4.5 i znacznie przewyższający 56% GPT-4o mini.
W programie MathVista (który testuje zdolność rozwiązywania problemów z obrazami) zarówno GPT-4.1, jak i GPT-4.1 mini uzyskały 57%, co znacznie przewyższa wynik GPT-4o mini, który wyniósł 37%.
W CharXiv-Reasoning , gdzie modele odpowiadają na pytania w oparciu o wykresy naukowe, GPT-4.1 nadal przoduje.
W przypadku Video-MME (długie filmy bez napisów) GPT-4.1 osiągnął wynik 72%, co stanowi znaczną poprawę w porównaniu z wynikiem GPT-4o, który wyniósł 65%.

O cenie:

GPT-4.1 kosztuje 2 dolary za 1 milion tokenów wejściowych i 8 dolarów za milion tokenów wyjściowych.
Cena modułu GPT-4.1 mini wynosi 0,40 USD za wejście i 1,60 USD za wyjście.
Koszt wejścia GPT-4.1 nano wynosi 0,10 USD, a wyjścia 0,40 USD.

Koszty te można dodatkowo obniżyć, korzystając z buforowania natychmiastowego lub interfejsu API wsadowego, co jest przydatne w przypadku aplikacji na dużą skalę. Firma OpenAI przygotowuje się również do zakończenia obsługi standardu GPT-4.5 Preview w dniu 14 lipca 2025 r., powołując się na lepszą wydajność, mniejsze opóźnienia i niższe koszty standardu GPT-4.1.

Tags: #openai #gpt-4.1 #model AI #sztuczna inteligencja

OpenAI ogłasza Operatora, agenta AI, który automatycznie wykonuje zadania w imieniu użytkownika

Firma stojąca za ChatGPT ujawnia nowy sposób wykorzystania sztucznej inteligencji. Firma OpenAI właśnie zapowiedziała Operatora, agenta AI, który może automatycznie wykonywać zadania za użytkownika.

OpenAI wprowadza nowe narzędzie, które pomoże programistom tworzyć agentów AI

Postrzegając agentów AI jako przyszłość branży sztucznej inteligencji, OpenAI przyznaje, że zbudowanie wydajnych agentów „klasy przemysłowej” przy użyciu obecnych narzędzi jest bardzo trudne.

Alibaba prezentuje QwQ-32b, godnego konkurenta DeepSeek

Czy obietnice Alibaby okażą się prawdziwe, pozostaje niewiadome, ale wygląda na to, że ChatGPT i DeepSeek mają teraz nowego, godnego konkurenta.

OpenAI rzuca wyzwanie Google Chrome dzięki swojej nowej przeglądarce

Według doniesień firma OpenAI pracuje nad projektem przeglądarki internetowej, która ma potencjał, aby bezpośrednio konkurować z przeglądarką Google Chrome.

Samsung współpracuje z OpenAI w celu opracowania telewizora AI, obiecując wiele interesujących funkcji

Według doniesień Samsung Electronics współpracuje z OpenAI przy ambitnym wspólnym projekcie mającym na celu opracowanie telewizorów AI, które będą zawierać wiodące w branży technologie sztucznej inteligencji.

Microsoft będzie nadal inwestować w OpenAI, którego wycena wyniesie ponad 100 miliardów dolarów

Od 2019 r. firma Microsoft zainwestowała miliardy dolarów w OpenAI, choć gigant oprogramowania z siedzibą w Redmond nie jest w żadnym wypadku głównym inwestorem w tym innowacyjnym startupie zajmującym się sztuczną inteligencją.

OpenAI ma zamiar przejąć Windsurf – jeden z najpotężniejszych na świecie edytorów kodu AI

OpenAI prowadzi rozmowy w sprawie przejęcia Windsurf, wiodącego w branży edytora kodu opartego na sztucznej inteligencji.

O1-pro to jak dotąd najdroższy model AI firmy OpenAI

Firma OpenAI udostępniła w swoim interfejsie API dla programistów bardziej zaawansowaną wersję swojego modelu sztucznej inteligencji o1 – o1-pro.

OpenAI ogłasza plan ChatGPT Pro za oszałamiające 200 USD miesięcznie

OpenAI oferuje obecnie cztery poziomy subskrypcji ChatGPT, aby sprostać potrzebom różnych grup klientów.

OpenAI wprowadza projekty ChatGPT: nowe funkcje umożliwiające inteligentniejszą organizację konwersacji

Tworząc projekt, użytkownicy mogą przechowywać rozmowy, pliki i instrukcje dotyczące dostosowywania w jednym miejscu. Dzięki temu mogą łatwo powrócić do tego, co robili wcześniej.

OpenAI ogłasza inicjatywę mającą na celu opracowanie standardów AI dla branż

OpenAI właśnie ogłosiło Program Pionierów – inicjatywę mającą na celu promowanie zastosowań sztucznej inteligencji w sytuacjach z życia wziętych.

Softbank planuje prześcignąć Microsoft i zostać największym inwestorem OpenAI

Japoński gigant inwestycyjny Softbank planuje zainwestować od 15 do 25 miliardów dolarów w OpenAI. Jeśli transakcja dojdzie do skutku, Softbank zostanie największym inwestorem OpenAI, zastępując firmę Microsoft, która obecnie zajmuje tę pozycję.

Użytkownicy mogą rozmawiać z Mikołajem, korzystając z trybu głosowego ChatGPT

Dzięki ChatGPT będziesz mógł wykonywać swoją pracę lepiej, dając Ci możliwość bezpośredniej rozmowy ze Świętym Mikołajem.

OpenAI wyda w grudniu Oriona, swój kolejny wielki model AI

Według doniesień The Verge firma OpenAI planuje wprowadzić na rynek w grudniu swój kolejny wiodący model sztucznej inteligencji – Orion.

Jak odzyskać dostęp do dysku twardego, naprawić błąd uniemożliwiający otwarcie dysku twardego

W tym artykule pokażemy Ci, jak odzyskać dostęp do dysku twardego w przypadku awarii. Sprawdźmy!

Jak korzystać z funkcji Conversation Awareness i Live Listen na AirPods

Na pierwszy rzut oka AirPodsy wyglądają jak każde inne prawdziwie bezprzewodowe słuchawki douszne. Ale wszystko się zmieniło, gdy odkryto kilka mało znanych funkcji.

Wszystko o iOS 26

Firma Apple wprowadziła system iOS 26 — dużą aktualizację z zupełnie nową obudową ze szkła matowego, inteligentniejszym interfejsem i udoskonaleniami znanych aplikacji.

Najlepsze laptopy dla studentów w 2025 roku

Studenci potrzebują konkretnego typu laptopa do nauki. Powinien być nie tylko wystarczająco wydajny, aby dobrze sprawdzać się na wybranym kierunku, ale także kompaktowy i lekki, aby można go było nosić przy sobie przez cały dzień.

Jak dodać drukarkę do systemu Windows 10

Dodanie drukarki do systemu Windows 10 jest proste, choć proces ten w przypadku urządzeń przewodowych będzie się różnić od procesu w przypadku urządzeń bezprzewodowych.

Jak sprawdzić pamięć RAM i błędy pamięci RAM na komputerze z najwyższą dokładnością

Jak wiadomo, pamięć RAM to bardzo ważny element sprzętowy komputera, który przetwarza dane i jest czynnikiem decydującym o szybkości laptopa lub komputera stacjonarnego. W poniższym artykule WebTech360 przedstawi Ci kilka sposobów sprawdzania błędów pamięci RAM za pomocą oprogramowania w systemie Windows.

Różnica między zwykłym telewizorem a Smart TV

Telewizory Smart TV naprawdę podbiły świat. Dzięki tak wielu świetnym funkcjom i możliwościom połączenia z Internetem technologia zmieniła sposób, w jaki oglądamy telewizję.

Dlaczego zamrażarka nie ma światła, a lodówka tak?

Lodówki to powszechnie stosowane urządzenia gospodarstwa domowego. Lodówki zazwyczaj mają dwie komory: komora chłodna jest pojemna i posiada światło, które włącza się automatycznie po każdym otwarciu lodówki, natomiast komora zamrażarki jest wąska i nie posiada światła.

2 sposoby na naprawę przeciążenia sieci, które spowalnia sieć Wi-Fi

Na działanie sieci Wi-Fi wpływa wiele czynników poza routerami, przepustowością i zakłóceniami. Istnieje jednak kilka sprytnych sposobów na usprawnienie działania sieci.

Jak obniżyć wersję iOS 17 do iOS 16 bez utraty danych za pomocą Tenorshare Reiboot

Jeśli chcesz powrócić do stabilnej wersji iOS 16 na swoim telefonie, poniżej znajdziesz podstawowy przewodnik, jak odinstalować iOS 17 i obniżyć wersję iOS 17 do 16.

Co dzieje się z organizmem, gdy codziennie jesz jogurt?

Jogurt jest wspaniałym produktem spożywczym. Czy warto jeść jogurt codziennie? Jak zmieni się Twoje ciało, gdy będziesz jeść jogurt codziennie? Przekonajmy się razem!

Który rodzaj ryżu jest najlepszy dla zdrowia?

W tym artykule omówiono najbardziej odżywcze rodzaje ryżu i dowiesz się, jak zmaksymalizować korzyści zdrowotne, jakie daje wybrany przez Ciebie rodzaj ryżu.

Jak obudzić się rano na czas

Ustalenie harmonogramu snu i rutyny związanej z kładzeniem się spać, zmiana budzika i dostosowanie diety to niektóre z działań, które mogą pomóc Ci lepiej spać i budzić się rano o odpowiedniej porze.

Wskazówki dotyczące gry Rent Please! Symulator wynajmującego dla nowicjuszy

Proszę o wynajem! Landlord Sim to mobilna gra symulacyjna dostępna na systemy iOS i Android. Wcielisz się w rolę właściciela kompleksu apartamentowego i wynajmiesz mieszkania, a Twoim celem jest odnowienie wnętrz apartamentów i przygotowanie ich na przyjęcie najemców.

Najnowsze kody do obrony wieży łazienkowej i jak je wprowadzać

Zdobądź kod do gry Bathroom Tower Defense Roblox i wymień go na atrakcyjne nagrody. Pomogą ci ulepszyć lub odblokować wieże zadające większe obrażenia.

OpenAI ogłasza GPT-4.1 — najinteligentniejszy model do złożonych zadań

Leave a Comment

OpenAI ogłasza Operatora, agenta AI, który automatycznie wykonuje zadania w imieniu użytkownika

OpenAI wprowadza nowe narzędzie, które pomoże programistom tworzyć agentów AI

Alibaba prezentuje QwQ-32b, godnego konkurenta DeepSeek

OpenAI rzuca wyzwanie Google Chrome dzięki swojej nowej przeglądarce

Samsung współpracuje z OpenAI w celu opracowania telewizora AI, obiecując wiele interesujących funkcji

Microsoft będzie nadal inwestować w OpenAI, którego wycena wyniesie ponad 100 miliardów dolarów

OpenAI ma zamiar przejąć Windsurf – jeden z najpotężniejszych na świecie edytorów kodu AI

O1-pro to jak dotąd najdroższy model AI firmy OpenAI

OpenAI ogłasza plan ChatGPT Pro za oszałamiające 200 USD miesięcznie

OpenAI wprowadza projekty ChatGPT: nowe funkcje umożliwiające inteligentniejszą organizację konwersacji

OpenAI ogłasza inicjatywę mającą na celu opracowanie standardów AI dla branż

Softbank planuje prześcignąć Microsoft i zostać największym inwestorem OpenAI

Użytkownicy mogą rozmawiać z Mikołajem, korzystając z trybu głosowego ChatGPT

OpenAI wyda w grudniu Oriona, swój kolejny wielki model AI

Jak odzyskać dostęp do dysku twardego, naprawić błąd uniemożliwiający otwarcie dysku twardego

Jak korzystać z funkcji Conversation Awareness i Live Listen na AirPods

Wszystko o iOS 26

Najlepsze laptopy dla studentów w 2025 roku

Jak dodać drukarkę do systemu Windows 10

Jak sprawdzić pamięć RAM i błędy pamięci RAM na komputerze z najwyższą dokładnością

Różnica między zwykłym telewizorem a Smart TV

Dlaczego zamrażarka nie ma światła, a lodówka tak?

2 sposoby na naprawę przeciążenia sieci, które spowalnia sieć Wi-Fi

Jak obniżyć wersję iOS 17 do iOS 16 bez utraty danych za pomocą Tenorshare Reiboot

Co dzieje się z organizmem, gdy codziennie jesz jogurt?

Który rodzaj ryżu jest najlepszy dla zdrowia?

Jak obudzić się rano na czas

Wskazówki dotyczące gry Rent Please! Symulator wynajmującego dla nowicjuszy

Najnowsze kody do obrony wieży łazienkowej i jak je wprowadzać