OpenAI ogłasza GPT-4.1 — najinteligentniejszy model do złożonych zadań

Firma OpenAI oficjalnie zaprezentowała trzy nowe modele: GPT-4.1, GPT-4.1 mini i GPT-4.1 nano. Modele te oferują ogromne możliwości przetwarzania kontekstu, sięgające nawet 1 miliona tokenów, oraz limity wiedzy aktualizowane do czerwca 2024 r.

Firma twierdzi, że modele te oferują lepsze wyniki niż ostatnio ulepszone modele GPT-4o i GPT-4o mini, które wprowadzono na rynek w lipcu ubiegłego roku. Obecnie standard GPT-4.1 jest dostępny tylko za pośrednictwem interfejsu API, dlatego nie będzie można go jeszcze używać bezpośrednio w ChatGPT.

OpenAI zaznacza, że ​​GPT-4.1 będzie dostępny wyłącznie poprzez API. W ChatGPT wiele udoskonaleń w zakresie zgodności instrukcji, programowania i inteligencji zostało stopniowo zintegrowanych z najnowszą wersją GPT-4o, a firma będzie nadal dodawać kolejne w przyszłych wydaniach.

OpenAI ogłasza GPT-4.1 — najinteligentniejszy model do złożonych zadań

Testy porównawcze pokazują znaczące udoskonalenia wprowadzane przez GPT-4.1. Model ten uzyskał wynik 54,6% w teście SWE-bench Verified, co stanowi wzrost o 21,4 punktu w stosunku do GPT-4o. Model uzyskał wynik 38,3% w teście MultiChallenge — ocenie mierzącej przestrzeganie wytycznych — i ustanowił nowy rekord w zakresie rozumienia długich filmów, uzyskując wynik 72,0% w teście Video-MME, w którym modele analizują filmy trwające do godziny bez napisów.

OpenAI nawiązało również współpracę z partnerami alfa w celu przetestowania wydajności GPT-4.1 w rzeczywistych zastosowaniach.

  • Thomson Reuters przetestował GPT-4.1 przy pomocy swojego asystenta prawnego CoCounsel, opartego na sztucznej inteligencji. W porównaniu z GPT-4o, GPT-4.1 odnotowuje 17% wzrost dokładności przy ocenie wielu dokumentów. Tego typu praca opiera się w dużej mierze na możliwości śledzenia kontekstu w wielu źródłach i identyfikowania złożonych powiązań, takich jak sprzeczne terminy lub ukryte zależności, a GPT-4.1 niezmiennie wykazuje wysoką wydajność.
  • Carlyle użył GPT-4.1 do wyodrębnienia danych finansowych z długich i złożonych dokumentów, w tym plików Excel i PDF. Według wewnętrznych testów firmy, model ten działa o 50% lepiej niż poprzednie modele przy wyszukiwaniu dokumentów. Jest to pierwszy model, który niezawodnie radzi sobie z takimi problemami, jak szukanie „igły w stogu siana”, gubienie informacji w środku dokumentu i argumenty wymagające łączenia informacji w wielu plikach.

Wydajność to jedno, ale równie ważna jest szybkość. Według OpenAI GPT-4.1 zwraca pierwszy token w ciągu około 15 sekund przy przetworzeniu 128 000 tokenów, a w przypadku przetworzenia pełnego miliona tokenów – nawet w ciągu 30 sekund. GPT-4.1 mini i nano są jeszcze szybsze.

GPT-4.1 nano zazwyczaj odpowiada w czasie krótszym niż 5 sekund na monity zawierające 128 000 tokenów wejściowych. Szybkie buforowanie może dodatkowo zmniejszyć opóźnienia i obniżyć koszty.

Znaczący postęp nastąpił także w rozumieniu obrazu. W szczególności GPT-4.1 mini przewyższa GPT-4o w różnych testach wydajności wizualnej.

  • W teście MMMU (obejmującym wykresy, diagramy i mapy) GPT-4.1 mini uzyskał wynik 73%. Jest to wynik wyższy niż GPT-4.5 i znacznie przewyższający 56% GPT-4o mini.
  • W programie MathVista (który testuje zdolność rozwiązywania problemów z obrazami) zarówno GPT-4.1, jak i GPT-4.1 mini uzyskały 57%, co znacznie przewyższa wynik GPT-4o mini, który wyniósł 37%.
  • W CharXiv-Reasoning , gdzie modele odpowiadają na pytania w oparciu o wykresy naukowe, GPT-4.1 nadal przoduje.
  • W przypadku Video-MME (długie filmy bez napisów) GPT-4.1 osiągnął wynik 72%, co stanowi znaczną poprawę w porównaniu z wynikiem GPT-4o, który wyniósł 65%.

O cenie:

  • GPT-4.1 kosztuje 2 dolary za 1 milion tokenów wejściowych i 8 dolarów za milion tokenów wyjściowych.
  • Cena modułu GPT-4.1 mini wynosi 0,40 USD za wejście i 1,60 USD za wyjście.
  • Koszt wejścia GPT-4.1 nano wynosi 0,10 USD, a wyjścia 0,40 USD.

Koszty te można dodatkowo obniżyć, korzystając z buforowania natychmiastowego lub interfejsu API wsadowego, co jest przydatne w przypadku aplikacji na dużą skalę. Firma OpenAI przygotowuje się również do zakończenia obsługi standardu GPT-4.5 Preview w dniu 14 lipca 2025 r., powołując się na lepszą wydajność, mniejsze opóźnienia i niższe koszty standardu GPT-4.1.

Sign up and earn $1000 a day ⋙

Leave a Comment

O1-pro to jak dotąd najdroższy model AI firmy OpenAI

O1-pro to jak dotąd najdroższy model AI firmy OpenAI

Firma OpenAI udostępniła w swoim interfejsie API dla programistów bardziej zaawansowaną wersję swojego modelu sztucznej inteligencji o1 – o1-pro.

OpenAI ogłasza plan ChatGPT Pro za oszałamiające 200 USD miesięcznie

OpenAI ogłasza plan ChatGPT Pro za oszałamiające 200 USD miesięcznie

OpenAI oferuje obecnie cztery poziomy subskrypcji ChatGPT, aby sprostać potrzebom różnych grup klientów.

OpenAI wprowadza projekty ChatGPT: nowe funkcje umożliwiające inteligentniejszą organizację konwersacji

OpenAI wprowadza projekty ChatGPT: nowe funkcje umożliwiające inteligentniejszą organizację konwersacji

Tworząc projekt, użytkownicy mogą przechowywać rozmowy, pliki i instrukcje dotyczące dostosowywania w jednym miejscu. Dzięki temu mogą łatwo powrócić do tego, co robili wcześniej.

OpenAI ogłasza inicjatywę mającą na celu opracowanie standardów AI dla branż

OpenAI ogłasza inicjatywę mającą na celu opracowanie standardów AI dla branż

OpenAI właśnie ogłosiło Program Pionierów – inicjatywę mającą na celu promowanie zastosowań sztucznej inteligencji w sytuacjach z życia wziętych.

Softbank planuje prześcignąć Microsoft i zostać największym inwestorem OpenAI

Softbank planuje prześcignąć Microsoft i zostać największym inwestorem OpenAI

Japoński gigant inwestycyjny Softbank planuje zainwestować od 15 do 25 miliardów dolarów w OpenAI. Jeśli transakcja dojdzie do skutku, Softbank zostanie największym inwestorem OpenAI, zastępując firmę Microsoft, która obecnie zajmuje tę pozycję.

Użytkownicy mogą rozmawiać z Mikołajem, korzystając z trybu głosowego ChatGPT

Użytkownicy mogą rozmawiać z Mikołajem, korzystając z trybu głosowego ChatGPT

Dzięki ChatGPT będziesz mógł wykonywać swoją pracę lepiej, dając Ci możliwość bezpośredniej rozmowy ze Świętym Mikołajem.

OpenAI wyda w grudniu Oriona, swój kolejny wielki model AI

OpenAI wyda w grudniu Oriona, swój kolejny wielki model AI

Według doniesień The Verge firma OpenAI planuje wprowadzić na rynek w grudniu swój kolejny wiodący model sztucznej inteligencji – Orion.

Alibaba wprowadza model AI, który potrafi odczytywać ludzkie emocje

Alibaba wprowadza model AI, który potrafi odczytywać ludzkie emocje

Chiński gigant e-commerce Alibaba nie przestaje być gwiazdą medialnej prasy za sprawą wprowadzenia na rynek nowego modelu sztucznej inteligencji, który, jak twierdzi firma, potrafi odczytywać ludzkie emocje.

OpenAI uruchamia sklep GPT i zespół ChatGPT, przenosząc ekosystem ChatGPT na wyższy poziom

OpenAI uruchamia sklep GPT i zespół ChatGPT, przenosząc ekosystem ChatGPT na wyższy poziom

Po długim oczekiwaniu i niezliczonych plotkach OpenAI w końcu ogłosiło długo oczekiwane uruchomienie sklepu GPT Store i zespołu ChatGPT.

Amazon ogłasza model Nova Sonic Sound, twierdzi, że wydajność przewyższa OpenAI i Google

Amazon ogłasza model Nova Sonic Sound, twierdzi, że wydajność przewyższa OpenAI i Google

Firma Amazon zaprezentowała dziś Nova Sonic, zaawansowany model przetwarzania mowy na mowę, który umożliwia programistom tworzenie aplikacji mogących komunikować się w czasie rzeczywistym za pomocą głosu przypominającego głos ludzki.

Copilot to najlepszy sposób na bezpłatne korzystanie z GPT-4 Turbo

Copilot to najlepszy sposób na bezpłatne korzystanie z GPT-4 Turbo

Jeśli chcesz wypróbować GPT-4 Turbo, najlepszym sposobem na to jest skorzystanie z narzędzia Copilot firmy Microsoft.

OpenAI po cichu zabija „bohatera” GPT-4

OpenAI po cichu zabija „bohatera” GPT-4

Firma OpenAI oficjalnie zaprzestaje rozwijania modelu GPT-4, jednego z najsłynniejszych modeli sztucznej inteligencji, który dwa lata temu stał się viralem.

OpenAI jest bliskie zawarcia umowy z Samsungiem w sprawie wykorzystania jego funkcji AI w telefonach Galaxy

OpenAI jest bliskie zawarcia umowy z Samsungiem w sprawie wykorzystania jego funkcji AI w telefonach Galaxy

Według południowokoreańskiej publikacji The Korea Herald, gigant w dziedzinie sztucznej inteligencji OpenAI chce przedstawić się jako potencjalny rywal Google.

OpenAI opracowuje technologię rekonstrukcji głosu na podstawie nagrania trwającego zaledwie 15 sekund

OpenAI opracowuje technologię rekonstrukcji głosu na podstawie nagrania trwającego zaledwie 15 sekund

OpenAI wprowadza technologię, która pozwala odtworzyć głos dowolnej osoby na podstawie nagrania trwającego zaledwie 15 sekund.

Przestrzeń do wspólnej zabawy, nazwij przestrzeń

Przestrzeń do wspólnej zabawy, nazwij przestrzeń

Wiele osób używa spacji w nazwach swoich kont Play Together lub małych podkreślników, aby utworzyć odstępy między literami wpisanymi w nazwie.

Jak pobrać Black Beacon PC

Jak pobrać Black Beacon PC

Choć gra Black Beacon jest możliwa na komputerze PC, to w chwili obecnej nie jest ona oficjalnie zoptymalizowana pod kątem tej platformy.

Wzór na obliczenie powierzchni i objętości kuli

Wzór na obliczenie powierzchni i objętości kuli

Powierzchnia kuli jest czterokrotnie większa od powierzchni dużego koła, która jest czterokrotnie większa od stałej Pi pomnożonej przez kwadrat promienia kuli.

Co jest szczególnego w skafandrze kosmicznym, który Chiny wybrały na pierwsze załogowe lądowanie na Księżycu?

Co jest szczególnego w skafandrze kosmicznym, który Chiny wybrały na pierwsze załogowe lądowanie na Księżycu?

Chiny planują wysłać pierwszych obywateli na Księżyc do 2030 roku. Kraj ten właśnie zaprezentował nowy skafander kosmiczny, który zostanie wykorzystany w nadchodzącej historycznej misji.

Produkty spożywcze, które łatwo wywołują stany zapalne w organizmie

Produkty spożywcze, które łatwo wywołują stany zapalne w organizmie

Wiele produktów spożywczych może powodować stany zapalne i przewlekłe choroby. Poniżej znajdziesz listę produktów, których należy unikać w nadmiernych ilościach, jeśli nie chcesz sprowadzić na swój organizm choroby.

Instrukcje dotyczące gry w Zuka Lien Quan Mobile sezon S1 2023

Instrukcje dotyczące gry w Zuka Lien Quan Mobile sezon S1 2023

Zuka to zabójca, który jest postrachem bohaterów o niskim poziomie zdrowia. Dowiedz się, jak skutecznie używać Zuki w sezonie 23.

Najnowszy kod Heroic Era i jak go wykorzystać

Najnowszy kod Heroic Era i jak go wykorzystać

Prawie wszyscy nowi gracze, dołączając do gry, odbierają prezenty za pośrednictwem kodów podarunkowych Heroic Age.

8 najtańszych dostawców pamięci masowej w chmurze

8 najtańszych dostawców pamięci masowej w chmurze

Przyjrzyjmy się najtańszym opcjom przechowywania danych w chmurze, jakie są dostępne. W tym artykule przyjrzymy się cenom zarówno w wartościach bezwzględnych, jak i za gigabajt (za miesiąc), abyś mógł wybrać najlepszą dla siebie opcję.

Czym jest błąd znaku funta (####) w programie Excel?

Czym jest błąd znaku funta (####) w programie Excel?

#### w programie Excel to częsty błąd, który pojawia się w wielu różnych przypadkach, gdy wprowadzamy dane, funkcje i formuły do ​​programu Excel.

12 ustawień w telefonach Samsung Galaxy, które powinieneś zmienić

12 ustawień w telefonach Samsung Galaxy, które powinieneś zmienić

Właśnie kupiłeś telefon Samsung Galaxy i musisz go skonfigurować? Oto 10 ustawień, które warto zmienić, aby Twój telefon Samsung działał lepiej.

Najnowsze kody do gry Murder Mystery 2 i jak je wprowadzić

Najnowsze kody do gry Murder Mystery 2 i jak je wprowadzić

Code Murder Mystery 2 pozwala graczom wybierać więcej skórek noży dla swoich postaci lub zdobywać więcej pieniędzy na usługi i inne rzeczy w grze.

28 pięknych wzorów kartek urodzinowych z życzeniami dla rodziców, małżonków, kochanków, przyjaciół

28 pięknych wzorów kartek urodzinowych z życzeniami dla rodziców, małżonków, kochanków, przyjaciół

W dniu urodzin ukochanej osoby, rodziców, przyjaciół, rodzeństwa, współpracowników... oprócz prezentów nie zapomnij wysłać kartek urodzinowych z życzeniami.

Zabawne, ale słodkie zagadki flirtowe, które „zdobędą” serce osoby, w której się zakochasz

Zabawne, ale słodkie zagadki flirtowe, które „zdobędą” serce osoby, w której się zakochasz

Te zabawne quizy pomogą Ci zrobić dobre wrażenie oraz szybko i szczęśliwie zdobyć serce osoby, w której się kochasz.

Corki DTCL sezon 7: Zbuduj przedmioty, standardowy oddział Corki Gunner

Corki DTCL sezon 7: Zbuduj przedmioty, standardowy oddział Corki Gunner

Corki DTCL sezon 7 potrzebuje ochrony lub wsparcia, aby przejąć kontrolę, jeśli chce móc swobodnie niszczyć drużynę przeciwną. Jednocześnie wyposażenie Corkiego musi być również standardowe, aby mógł zadawać skuteczniejsze obrażenia.

Jak pobrać Mini World Royale i instrukcje dotyczące gry

Jak pobrać Mini World Royale i instrukcje dotyczące gry

Oto link do pobrania Mini World Royale i instrukcja gry. Gra będzie dostępna w dwóch wersjach: Mini World Royale APK i Mini World Royale iOS.