Deepseek udostępnia bezpłatny model języka v3, który dobrze działa na typowych konfiguracjach sprzętowych

Chiński startup zajmujący się sztuczną inteligencją DeepSeek właśnie oficjalnie wydał swój najnowszy model języka dużego (LLM) o nazwie DeepSeek-V3-0324. Model ten, o pojemności do 641 GB, został zaprezentowany na platformie AI Hugging Face bez ujawniania zbyt wielu informacji, zgodnie z pełnym tajemnicy stylem, jaki firma do tej pory stosowała w odniesieniu do nowych produktów.

Cechą szczególną tego modelu jest licencja MIT, która pozwala na bezpłatne wykorzystanie w celach komercyjnych. Wstępne wyniki testów porównawczych pokazują, że DeepSeek-V3-0324 może działać na standardowych konfiguracjach sprzętowych, takich jak Mac Studio firmy Apple z procesorem M3 Ultra. Naukowiec zajmujący się sztuczną inteligencją Awni Hannun poinformował, że przy użyciu tej konfiguracji możliwe było osiągnięcie prędkości przetwarzania przekraczającej 20 tokenów na sekundę. Możliwość uruchamiania rozbudowanego modelu językowego na ogólnodostępnym sprzęcie lokalnym stoi w wyraźnym kontraście do tradycyjnego podejścia polegającego na wykorzystywaniu ogromnej infrastruktury centrów danych do obsługi zaawansowanych modeli sztucznej inteligencji.

Deepseek udostępnia bezpłatny model języka v3, który dobrze działa na typowych konfiguracjach sprzętowych

Według informacji DeepSeek, wstępne testy wykazały znaczącą poprawę w stosunku do poprzednich wersji. Model ten został poddany rygorystycznym testom przez wewnętrznych interesariuszy i wykazał doskonałą wydajność, przewyższając nawet wszystkie inne konkurencyjne modele i model Claude Sonnet 3.5 firmy Anthropic w zadaniach niewymagających głębokiego myślenia. Jednak w przeciwieństwie do modeli w stylu Sonnet, które wymagają płatnej subskrypcji, DeepSeek-V3-0324 można pobrać i używać całkowicie bezpłatnie.

Technicznie rzecz biorąc, DeepSeek-V3-0324 wykorzystuje architekturę mieszanych ekspertów (MoE). Wyróżnia się zdolnością do selektywnego wykorzystywania około 37 miliardów z 685 miliardów parametrów na zadanie, co pozwala na zwiększenie efektywności poprzez redukcję wymagań obliczeniowych przy jednoczesnym zachowaniu wydajności. Model ten wykorzystuje również technologie Multi-Head Latent Attention (MLA) i Multi-Token Prediction (MTP), które przyczyniają się do ulepszenia pamięci kontekstowej i przyspieszenia wyników.

Użytkownicy mogą uzyskać dostęp do DeepSeek-V3-0324 za pośrednictwem Hugging Face, interfejsu czatu i API OpenRouter, a także, jeśli zajdzie taka potrzeba, platformy czatu DeepSeek. Dostęp do modelu zapewnia również dostawca usług wnioskowania Hyperbolic Labs.

Dzięki wydaniu DeepSeek-V3-0324 firma umacnia swoją pozycję w wyścigu o rozwój dużych modeli językowych, zapewniając jednocześnie potężne i dostępne rozwiązanie dla społeczności zajmującej się badaniami i rozwojem sztucznej inteligencji. Możliwość uruchomienia na powszechnie dostępnym sprzęcie i darmowa licencja z pewnością otworzą wiele możliwości praktycznego zastosowania tego modelu w niedalekiej przyszłości.

Sign up and earn $1000 a day ⋙

Leave a Comment

Microsoft integruje DeepSeek z platformą PC Copilot+

Microsoft integruje DeepSeek z platformą PC Copilot+

W styczniu firma Microsoft ogłosiła plany wprowadzenia zoptymalizowanych pod kątem NPU wersji modelu DeepSeek-R1 bezpośrednio do komputerów Copilot+ działających na procesorach Qualcomm Snapdragon X.

Jak szybko zarejestrować konto DeepSeek

Jak szybko zarejestrować konto DeepSeek

Chińska aplikacja oparta na sztucznej inteligencji DeepSeek jest obecnie liderem na liście najpopularniejszych aplikacji w sklepach z aplikacjami.

Oszuści wykorzystują Deepseek do kradzieży danych użytkowników

Oszuści wykorzystują Deepseek do kradzieży danych użytkowników

Cyberprzestępcy tworzą tysiące stron internetowych podobnych do DeepSeek, licząc na to, że niczego niepodejrzewający użytkownicy podadzą im swoje dane osobowe.

Softbank planuje prześcignąć Microsoft i zostać największym inwestorem OpenAI

Softbank planuje prześcignąć Microsoft i zostać największym inwestorem OpenAI

Japoński gigant inwestycyjny Softbank planuje zainwestować od 15 do 25 miliardów dolarów w OpenAI. Jeśli transakcja dojdzie do skutku, Softbank zostanie największym inwestorem OpenAI, zastępując firmę Microsoft, która obecnie zajmuje tę pozycję.

Te fałszywe reklamy DeepSeek rozprzestrzeniają niebezpieczne złośliwe oprogramowanie

Te fałszywe reklamy DeepSeek rozprzestrzeniają niebezpieczne złośliwe oprogramowanie

Seria oszukańczych reklam DeepSeek w Google zawiera niebezpieczne złośliwe oprogramowanie kradnące informacje nieświadomym użytkownikom DeepSeek.

DeepSeek zaprasza użytkowników do odkrywania kulis otwartego kodu źródłowego sztucznej inteligencji firmy

DeepSeek zaprasza użytkowników do odkrywania kulis otwartego kodu źródłowego sztucznej inteligencji firmy

Chiński startup zajmujący się sztuczną inteligencją DeepSeek planuje zwiększyć „transparentność” technologii stojącej za jego modelami AI opartymi na otwartym kodzie źródłowym, takimi jak model rozumowania R1.

Huawei wprowadza na rynek składany telefon Pura X z asystentem DeepSeek AI

Huawei wprowadza na rynek składany telefon Pura X z asystentem DeepSeek AI

Huawei wkracza w erę całkowicie wolną od Androida, wprowadzając Pura X, nowy składany telefon działający pod kontrolą oprogramowania HarmonyOS 5 i pozbawiony opcji korzystania z systemu operacyjnego Google.

4 powody, dla których powinieneś porzucić ChatGPT i zacząć używać DeepSeek

4 powody, dla których powinieneś porzucić ChatGPT i zacząć używać DeepSeek

DeepSeek to nazwa chińskiej firmy zajmującej się sztuczną inteligencją i jej chatbota o tej samej nazwie. Flagowe modele firmy, DeepSeek-V3 i DeepSeek-R1, zrobiły furorę, ponieważ ich szkolenie i użytkowanie są tańsze niż ich odpowiedniki.

Zapomnij o RTX 5070, nawet RTX 5080 nie pokona RTX 4090

Zapomnij o RTX 5070, nawet RTX 5080 nie pokona RTX 4090

Miniony tydzień nie był szczęśliwy dla inwestorów i fanów firmy Nvidia.

USA rozważają zbadanie przemytu procesorów graficznych Nvidia do Chin w celu uruchomienia DeepSeek

USA rozważają zbadanie przemytu procesorów graficznych Nvidia do Chin w celu uruchomienia DeepSeek

DeepSeek, chińska firma stojąca za darmowym modelem sztucznej inteligencji, który wstrząsa światem technologii, mierzy się z szeregiem negatywnych oskarżeń, między innymi o wykorzystywanie przemycanych procesorów graficznych Nvidia do trenowania i uruchamiania jej modelu sztucznej inteligencji.

8 głównych wad telefonów ze składanym ekranem, których się nie spodziewałeś

8 głównych wad telefonów ze składanym ekranem, których się nie spodziewałeś

Nie da się zaprzeczyć, że składane telefony są naprawdę fajne. Jednak po pewnym czasie użytkowania można zauważyć pewne dziwactwa tego urządzenia. Oto 5 głównych wad telefonów ze składanym ekranem, których się nie spodziewałeś!

Adobe wprowadza technologię tworzenia wideo AI do Premiere Pro

Adobe wprowadza technologię tworzenia wideo AI do Premiere Pro

Firma Adobe udostępniła masom technologię tworzenia filmów przy użyciu sztucznej inteligencji w nowy sposób, ale nie udało jej się jeszcze stworzyć żadnego ukończonego filmu z wykorzystaniem tej technologii.

Najnowsze kody Genshin Impact kwiecień 2025

Najnowsze kody Genshin Impact kwiecień 2025

Kod Genshin Impact 5.5 pomaga w wymianie na Pierwotne Kamienie, Magiczne Minerały, doświadczenie i wiele innych nagród.

Jak zamienić iPada w dodatkowy wyświetlacz Maca

Jak zamienić iPada w dodatkowy wyświetlacz Maca

macOS Catalina i iPadOS obsługują nową funkcję o nazwie Sidecar, która pozwala używać iPada jako dodatkowego wyświetlacza dla komputera Mac.

Tapeta 1280, piękna tapeta na telefon Nokia 1280

Tapeta 1280, piękna tapeta na telefon Nokia 1280

Oto zestaw tapet do telefonu Nokia 1280. Jeśli kiedykolwiek pisałeś SMS-a z prośbą o tapety 1280, tapety do telefonu-cegły, to spróbuj obejrzeć te tapety.

Samolot kosmiczny hipersoniczny osiągnął prędkość 11 115 km/h

Samolot kosmiczny hipersoniczny osiągnął prędkość 11 115 km/h

Firma Venus Aerospace opublikowała pierwsze zdjęcia swojego nowego hipersonicznego samolotu o nazwie Stargazer, który może osiągnąć prędkość maksymalną 11 115 km/h, co odpowiada Mach 9.

Jedzenie bananów na śniadanie pomaga zmniejszyć wzdęcia

Jedzenie bananów na śniadanie pomaga zmniejszyć wzdęcia

Wzdęcia mogą przytrafić się każdemu. Dobra wiadomość jest taka, że ​​śniadanie to doskonały moment, aby dodać do posiłku składniki, które pomogą zredukować wzdęcia. Tym składnikiem jest banan.

OpenAI ogłasza dużą aktualizację generowania obrazów AI w ChatGPT

OpenAI ogłasza dużą aktualizację generowania obrazów AI w ChatGPT

Firma OpenAI właśnie oficjalnie wprowadziła znaczącą modernizację możliwości generowania obrazów AI w ChatGPT. To ważny krok naprzód w porównaniu z używaniem oddzielnego modelu generowania obrazów, jak w poprzednim modelu DALL-E.

Deepseek udostępnia bezpłatny model języka v3, który dobrze działa na typowych konfiguracjach sprzętowych

Deepseek udostępnia bezpłatny model języka v3, który dobrze działa na typowych konfiguracjach sprzętowych

Chiński startup zajmujący się sztuczną inteligencją DeepSeek właśnie oficjalnie wydał swój najnowszy model języka dużego (LLM) o nazwie DeepSeek-V3-0324.

Powody, dla których warto porzucić Gboard i przejść na klawiaturę Samsung

Powody, dla których warto porzucić Gboard i przejść na klawiaturę Samsung

Gboard od dawna jest klawiaturą standardową w telefonach z Androidem. Jednak wiele osób niedawno przeszło na klawiaturę Samsunga i nie żałuje tej decyzji.

Słodkie i romantyczne życzenia weekendowe dla zakochanych

Słodkie i romantyczne życzenia weekendowe dla zakochanych

Wyślij słodkie i romantyczne życzenia weekendowe swojej ukochanej osobie. Mimo że są to tylko słowa i wiadomości, stanowią one znaczący dar duchowy, który pomoże wzmocnić waszą relację.

Aby serial telewizyjny o Harrym Potterze odniósł sukces, potrzebne są następujące elementy

Aby serial telewizyjny o Harrym Potterze odniósł sukces, potrzebne są następujące elementy

Premiera remake'u Harry'ego Pottera produkcji HBO planowana jest na 2026 rok. Oto, co sprawia, że ​​telewizyjny Harry Potter odniósł sukces.

Oszałamiające zdjęcia superksiężyca z całego świata

Oszałamiające zdjęcia superksiężyca z całego świata

Piękne zdjęcia księżyca nie są rzadkością w Internecie. W tym artykule znajdziesz podsumowanie najpiękniejszych zdjęć księżyca na świecie.

Użytkownicy procesorów AMD Ryzen powinni zainstalować tę aktualizację BIOS-u, aby uzyskać bezpłatny wzrost wydajności

Użytkownicy procesorów AMD Ryzen powinni zainstalować tę aktualizację BIOS-u, aby uzyskać bezpłatny wzrost wydajności

Teraz firma AMD odpowiedziała na problemy ze swoją flagową linią procesorów, wprowadzając nową aktualizację, która może zapewnić o kilka klatek na sekundę więcej.

Wartość X spada z 44 miliardów dolarów do poniżej 10 miliardów dolarów

Wartość X spada z 44 miliardów dolarów do poniżej 10 miliardów dolarów

W październiku 2022 r. Elon Musk wydał 44 miliardy dolarów na przejęcie X, jednak od tego czasu wartość platformy spadła o 78,6% do około 9,4 miliarda dolarów.