Deepseek udostępnia bezpłatny model języka v3, który dobrze działa na typowych konfiguracjach sprzętowych

Chiński startup zajmujący się sztuczną inteligencją DeepSeek właśnie oficjalnie wydał swój najnowszy model języka dużego (LLM) o nazwie DeepSeek-V3-0324. Model ten, o pojemności do 641 GB, został zaprezentowany na platformie AI Hugging Face bez ujawniania zbyt wielu informacji, zgodnie z pełnym tajemnicy stylem, jaki firma do tej pory stosowała w odniesieniu do nowych produktów.

Cechą szczególną tego modelu jest licencja MIT, która pozwala na bezpłatne wykorzystanie w celach komercyjnych. Wstępne wyniki testów porównawczych pokazują, że DeepSeek-V3-0324 może działać na standardowych konfiguracjach sprzętowych, takich jak Mac Studio firmy Apple z procesorem M3 Ultra. Naukowiec zajmujący się sztuczną inteligencją Awni Hannun poinformował, że przy użyciu tej konfiguracji możliwe było osiągnięcie prędkości przetwarzania przekraczającej 20 tokenów na sekundę. Możliwość uruchamiania rozbudowanego modelu językowego na ogólnodostępnym sprzęcie lokalnym stoi w wyraźnym kontraście do tradycyjnego podejścia polegającego na wykorzystywaniu ogromnej infrastruktury centrów danych do obsługi zaawansowanych modeli sztucznej inteligencji.

Deepseek udostępnia bezpłatny model języka v3, który dobrze działa na typowych konfiguracjach sprzętowych

Według informacji DeepSeek, wstępne testy wykazały znaczącą poprawę w stosunku do poprzednich wersji. Model ten został poddany rygorystycznym testom przez wewnętrznych interesariuszy i wykazał doskonałą wydajność, przewyższając nawet wszystkie inne konkurencyjne modele i model Claude Sonnet 3.5 firmy Anthropic w zadaniach niewymagających głębokiego myślenia. Jednak w przeciwieństwie do modeli w stylu Sonnet, które wymagają płatnej subskrypcji, DeepSeek-V3-0324 można pobrać i używać całkowicie bezpłatnie.

Technicznie rzecz biorąc, DeepSeek-V3-0324 wykorzystuje architekturę mieszanych ekspertów (MoE). Wyróżnia się zdolnością do selektywnego wykorzystywania około 37 miliardów z 685 miliardów parametrów na zadanie, co pozwala na zwiększenie efektywności poprzez redukcję wymagań obliczeniowych przy jednoczesnym zachowaniu wydajności. Model ten wykorzystuje również technologie Multi-Head Latent Attention (MLA) i Multi-Token Prediction (MTP), które przyczyniają się do ulepszenia pamięci kontekstowej i przyspieszenia wyników.

Użytkownicy mogą uzyskać dostęp do DeepSeek-V3-0324 za pośrednictwem Hugging Face, interfejsu czatu i API OpenRouter, a także, jeśli zajdzie taka potrzeba, platformy czatu DeepSeek. Dostęp do modelu zapewnia również dostawca usług wnioskowania Hyperbolic Labs.

Dzięki wydaniu DeepSeek-V3-0324 firma umacnia swoją pozycję w wyścigu o rozwój dużych modeli językowych, zapewniając jednocześnie potężne i dostępne rozwiązanie dla społeczności zajmującej się badaniami i rozwojem sztucznej inteligencji. Możliwość uruchomienia na powszechnie dostępnym sprzęcie i darmowa licencja z pewnością otworzą wiele możliwości praktycznego zastosowania tego modelu w niedalekiej przyszłości.

Sign up and earn $1000 a day ⋙

Leave a Comment

Dlaczego ChatGPT jest lepszy niż DeepSeek

Dlaczego ChatGPT jest lepszy niż DeepSeek

Początkowo ludzie wiązali duże nadzieje z DeepSeek. Jako chatbot oparty na sztucznej inteligencji, reklamowany jako silny konkurent ChatGPT, obiecuje inteligentne możliwości i doświadczenia związane z czatem.

Alibaba prezentuje QwQ-32b, godnego konkurenta DeepSeek

Alibaba prezentuje QwQ-32b, godnego konkurenta DeepSeek

Czy obietnice Alibaby okażą się prawdziwe, pozostaje niewiadome, ale wygląda na to, że ChatGPT i DeepSeek mają teraz nowego, godnego konkurenta.

Microsoft integruje DeepSeek z platformą PC Copilot+

Microsoft integruje DeepSeek z platformą PC Copilot+

W styczniu firma Microsoft ogłosiła plany wprowadzenia zoptymalizowanych pod kątem NPU wersji modelu DeepSeek-R1 bezpośrednio do komputerów Copilot+ działających na procesorach Qualcomm Snapdragon X.

Jak szybko zarejestrować konto DeepSeek

Jak szybko zarejestrować konto DeepSeek

Chińska aplikacja oparta na sztucznej inteligencji DeepSeek jest obecnie liderem na liście najpopularniejszych aplikacji w sklepach z aplikacjami.

Oszuści wykorzystują Deepseek do kradzieży danych użytkowników

Oszuści wykorzystują Deepseek do kradzieży danych użytkowników

Cyberprzestępcy tworzą tysiące stron internetowych podobnych do DeepSeek, licząc na to, że niczego niepodejrzewający użytkownicy podadzą im swoje dane osobowe.

Softbank planuje prześcignąć Microsoft i zostać największym inwestorem OpenAI

Softbank planuje prześcignąć Microsoft i zostać największym inwestorem OpenAI

Japoński gigant inwestycyjny Softbank planuje zainwestować od 15 do 25 miliardów dolarów w OpenAI. Jeśli transakcja dojdzie do skutku, Softbank zostanie największym inwestorem OpenAI, zastępując firmę Microsoft, która obecnie zajmuje tę pozycję.

Te fałszywe reklamy DeepSeek rozprzestrzeniają niebezpieczne złośliwe oprogramowanie

Te fałszywe reklamy DeepSeek rozprzestrzeniają niebezpieczne złośliwe oprogramowanie

Seria oszukańczych reklam DeepSeek w Google zawiera niebezpieczne złośliwe oprogramowanie kradnące informacje nieświadomym użytkownikom DeepSeek.

DeepSeek zaprasza użytkowników do odkrywania kulis otwartego kodu źródłowego sztucznej inteligencji firmy

DeepSeek zaprasza użytkowników do odkrywania kulis otwartego kodu źródłowego sztucznej inteligencji firmy

Chiński startup zajmujący się sztuczną inteligencją DeepSeek planuje zwiększyć „transparentność” technologii stojącej za jego modelami AI opartymi na otwartym kodzie źródłowym, takimi jak model rozumowania R1.

Huawei wprowadza na rynek składany telefon Pura X z asystentem DeepSeek AI

Huawei wprowadza na rynek składany telefon Pura X z asystentem DeepSeek AI

Huawei wkracza w erę całkowicie wolną od Androida, wprowadzając Pura X, nowy składany telefon działający pod kontrolą oprogramowania HarmonyOS 5 i pozbawiony opcji korzystania z systemu operacyjnego Google.

4 powody, dla których powinieneś porzucić ChatGPT i zacząć używać DeepSeek

4 powody, dla których powinieneś porzucić ChatGPT i zacząć używać DeepSeek

DeepSeek to nazwa chińskiej firmy zajmującej się sztuczną inteligencją i jej chatbota o tej samej nazwie. Flagowe modele firmy, DeepSeek-V3 i DeepSeek-R1, zrobiły furorę, ponieważ ich szkolenie i użytkowanie są tańsze niż ich odpowiedniki.

Zapomnij o RTX 5070, nawet RTX 5080 nie pokona RTX 4090

Zapomnij o RTX 5070, nawet RTX 5080 nie pokona RTX 4090

Miniony tydzień nie był szczęśliwy dla inwestorów i fanów firmy Nvidia.

USA rozważają zbadanie przemytu procesorów graficznych Nvidia do Chin w celu uruchomienia DeepSeek

USA rozważają zbadanie przemytu procesorów graficznych Nvidia do Chin w celu uruchomienia DeepSeek

DeepSeek, chińska firma stojąca za darmowym modelem sztucznej inteligencji, który wstrząsa światem technologii, mierzy się z szeregiem negatywnych oskarżeń, między innymi o wykorzystywanie przemycanych procesorów graficznych Nvidia do trenowania i uruchamiania jej modelu sztucznej inteligencji.

Różnica między zwykłym telewizorem a Smart TV

Różnica między zwykłym telewizorem a Smart TV

Telewizory Smart TV naprawdę podbiły świat. Dzięki tak wielu świetnym funkcjom i możliwościom połączenia z Internetem technologia zmieniła sposób, w jaki oglądamy telewizję.

Dlaczego zamrażarka nie ma światła, a lodówka tak?

Dlaczego zamrażarka nie ma światła, a lodówka tak?

Lodówki to powszechnie stosowane urządzenia gospodarstwa domowego. Lodówki zazwyczaj mają dwie komory: komora chłodna jest pojemna i posiada światło, które włącza się automatycznie po każdym otwarciu lodówki, natomiast komora zamrażarki jest wąska i nie posiada światła.

2 sposoby na naprawę przeciążenia sieci, które spowalnia sieć Wi-Fi

2 sposoby na naprawę przeciążenia sieci, które spowalnia sieć Wi-Fi

Na działanie sieci Wi-Fi wpływa wiele czynników poza routerami, przepustowością i zakłóceniami. Istnieje jednak kilka sprytnych sposobów na usprawnienie działania sieci.

Jak obniżyć wersję iOS 17 do iOS 16 bez utraty danych za pomocą Tenorshare Reiboot

Jak obniżyć wersję iOS 17 do iOS 16 bez utraty danych za pomocą Tenorshare Reiboot

Jeśli chcesz powrócić do stabilnej wersji iOS 16 na swoim telefonie, poniżej znajdziesz podstawowy przewodnik, jak odinstalować iOS 17 i obniżyć wersję iOS 17 do 16.

Co dzieje się z organizmem, gdy codziennie jesz jogurt?

Co dzieje się z organizmem, gdy codziennie jesz jogurt?

Jogurt jest wspaniałym produktem spożywczym. Czy warto jeść jogurt codziennie? Jak zmieni się Twoje ciało, gdy będziesz jeść jogurt codziennie? Przekonajmy się razem!

Który rodzaj ryżu jest najlepszy dla zdrowia?

Który rodzaj ryżu jest najlepszy dla zdrowia?

W tym artykule omówiono najbardziej odżywcze rodzaje ryżu i dowiesz się, jak zmaksymalizować korzyści zdrowotne, jakie daje wybrany przez Ciebie rodzaj ryżu.

Jak obudzić się rano na czas

Jak obudzić się rano na czas

Ustalenie harmonogramu snu i rutyny związanej z kładzeniem się spać, zmiana budzika i dostosowanie diety to niektóre z działań, które mogą pomóc Ci lepiej spać i budzić się rano o odpowiedniej porze.

Wskazówki dotyczące gry Rent Please! Symulator wynajmującego dla nowicjuszy

Wskazówki dotyczące gry Rent Please! Symulator wynajmującego dla nowicjuszy

Proszę o wynajem! Landlord Sim to mobilna gra symulacyjna dostępna na systemy iOS i Android. Wcielisz się w rolę właściciela kompleksu apartamentowego i wynajmiesz mieszkania, a Twoim celem jest odnowienie wnętrz apartamentów i przygotowanie ich na przyjęcie najemców.

Najnowsze kody do obrony wieży łazienkowej i jak je wprowadzać

Najnowsze kody do obrony wieży łazienkowej i jak je wprowadzać

Zdobądź kod do gry Bathroom Tower Defense Roblox i wymień go na atrakcyjne nagrody. Pomogą ci ulepszyć lub odblokować wieże zadające większe obrażenia.

Budowa, symbole i zasady działania transformatorów

Budowa, symbole i zasady działania transformatorów

Poznajmy budowę, symbole i zasady działania transformatorów w jak najbardziej dokładny spos��b.

4 sposoby, w jakie sztuczna inteligencja ulepsza inteligentne telewizory

4 sposoby, w jakie sztuczna inteligencja ulepsza inteligentne telewizory

Od lepszej jakości obrazu i dźwięku po sterowanie głosowe i wiele więcej — te funkcje oparte na sztucznej inteligencji sprawiają, że inteligentne telewizory stają się o wiele lepsze!

Dlaczego ChatGPT jest lepszy niż DeepSeek

Dlaczego ChatGPT jest lepszy niż DeepSeek

Początkowo ludzie wiązali duże nadzieje z DeepSeek. Jako chatbot oparty na sztucznej inteligencji, reklamowany jako silny konkurent ChatGPT, obiecuje inteligentne możliwości i doświadczenia związane z czatem.

Poznaj Fireflies.ai: darmową sekretarkę AI, która zaoszczędzi Ci godzin pracy

Poznaj Fireflies.ai: darmową sekretarkę AI, która zaoszczędzi Ci godzin pracy

Łatwo jest przegapić ważne szczegóły podczas zapisywania innych istotnych informacji, a próba robienia notatek podczas rozmowy może być rozpraszająca. Rozwiązaniem jest Fireflies.ai.

Jak hodować aksolotla w Minecraft, oswoić salamandrę w Minecraft

Jak hodować aksolotla w Minecraft, oswoić salamandrę w Minecraft

Axolot Minecraft będzie świetnym pomocnikiem dla graczy operujących pod wodą, jeśli tylko będą umieli się nim posługiwać.

Konfiguracja gry A Quiet Place: The Road Ahead na PC

Konfiguracja gry A Quiet Place: The Road Ahead na PC

Konfiguracja gry A Quiet Place: The Road Ahead została oceniona dość wysoko, dlatego też przed podjęciem decyzji o pobraniu należy wziąć ją pod uwagę.