Firma Alibaba właśnie oficjalnie ogłosiła swój najnowszy model wnioskowania i wygląda na to, że DeepSeek i OpenAI mają powody do obaw — jeśli całe „rozgłos” wokół Alibaby okaże się prawdą. Model ten jest dostępny w ramach otwartego kodu źródłowego, co oznacza, że każdy może uzyskać do niego dostęp i wypróbować go za darmo.
Nowy model sztucznej inteligencji Alibaby, nazwany QwQ-32b (Quan-z-pytaniami), działa na podstawie znacznie mniejszej liczby parametrów niż większość głównych modeli językowych, co oznacza, że wymaga mniejszej ilości zasobów. Alibaba twierdzi, że QwQ-32b działa na tym samym poziomie co DeepSeek lub o1-mini firmy OpenAI.
Model wielojęzykowy DeepSeek-R1 (LLM) wywołał poruszenie po premierze na początku lutego, kwestionując złoty standard ustanowiony przez ChatGPT, ale przy znacznie niższych kosztach operacyjnych. Wygląda na to, że dzięki QwQ-32b Alibaba chce przesunąć te granice jeszcze dalej.
Technicznie rzecz biorąc DeepSeek-R1 wymaga do działania 671 miliardów parametrów, przy czym włączonych jest 37 miliardów parametrów. Tymczasem QwQ-32b firmy Alibaba potrzebuje zaledwie 32 miliardów parametrów. Dla wielu liczby te mogą wydawać się abstrakcyjne, jednak mają one ogromne znaczenie dla mocy obliczeniowej: podczas gdy DeepSeek-R1 wymagał do działania 1600 GB pamięci VRAM, QwQ-32b potrzebuje zaledwie 24 GB pamięci VRAM. W większości przypadków będzie to wymagało karty graficznej, takiej jak Nvidia H100 lub równoważnej, ale nawet przyjazna graczom karta RTX 4090 ma 24 GB pamięci VRAM. Najnowszy RTX 5090 zwiększa tę liczbę do 32 GB.
Twierdzi się nawet, że nawet przy zaledwie 32 miliardach parametrów, QwQ-32B nadal zapewnia wydajność równą lub lepszą od R1 w takich obszarach jak matematyka, programowanie i ogólne rozwiązywanie problemów. Alibaba stwierdziła również, że QwQ-32B przewyższa o1-mini firmy OpenAI, który został zbudowany na podstawie 100 miliardów parametrów. QwQ-32B jest dostępny w Hugging Face, największej na świecie społeczności open source zajmującej się modelami sztucznej inteligencji.

Oprogramowanie QwQ-32b firmy Alibaba jest dostępne na licencji Apache 2.0, co oznacza, że firmy i naukowcy mogą z niego swobodnie korzystać. Co ważniejsze, możemy wypróbować tę funkcję za pośrednictwem Qwen Chat w serwisie Alibaba. Podobnie jak DeepSeek, QwQ-32b ma pewne ograniczenia w zakresie tematów. Na przykład, gdy Qwen Chat zapyta Cię o kwestie polityczne, wyświetli komunikat, że jest to niewłaściwy temat. Ale jest też kilka zalet, które rzucają się w oczy od razu.
QwQ-32b wydaje się udzielać dość szczegółowych odpowiedzi nawet na krótkie i proste pytania. Może to być dobre, ale w pewnym sensie jest też dość irytujące, bo podaje wiele niepotrzebnych informacji, o które nie prosiłeś. Jedną z zalet jest to, że QwQ-32b może pokazać cały proces rozumowania, podobnie jak funkcja Deep Thinking w ChatGPT — ale z mniejszą głębią.
Czy obietnice Alibaby okażą się prawdziwe, pozostaje niewiadome, ale wygląda na to, że ChatGPT i DeepSeek mają teraz nowego, godnego konkurenta.