Cerebras wprowadza najszybszą na świecie technologię wnioskowania AI, 20 razy wydajniejszą niż NVIDIA

Firma Cerebras Systems właśnie oficjalnie zaprezentowała rozwiązanie Cerebras Inference, uważane za najszybsze na świecie rozwiązanie do wnioskowania oparte na sztucznej inteligencji. Rozwiązanie Cerebras Inference zapewnia wydajność do 1800 tokenów na sekundę w przypadku modeli Llama 3.1 8B (8 miliardów parametrów) oraz 450 tokenów na sekundę w przypadku modeli Llama 3.1 70B, co jest wynikiem niemal 20-krotnie szybszym od rozwiązań do wnioskowania AI opartych na procesorach graficznych NVIDIA dostępnych w dzisiejszych chmurach hiperskalowych na całym świecie, w tym w Microsoft Azure.

Oprócz niesamowitej wydajności, cena usług tego nowego rozwiązania wnioskowania jest również bardzo niska, stanowiąc ułamek ceny popularnych platform chmurowych GPU. Na przykład klient może otrzymać milion tokenów za jedyne 10 centów, co zapewnia 100-krotnie lepszy stosunek ceny do jakości w przypadku obciążeń związanych ze sztuczną inteligencją.

16-bitowa precyzja i 20-krotnie szybsza prędkość wnioskowania Cerebras umożliwią programistom tworzenie wydajnych aplikacji AI nowej generacji bez uszczerbku dla szybkości i kosztów. Ten przełomowy stosunek ceny do wydajności jest możliwy dzięki systemowi Cerebras CS-3 i procesorowi AI Wafer Scale Engine 3 (WSE-3). CS-3 oferuje 7000 razy większą przepustowość pamięci niż Nvidia H100, rozwiązując tym samym techniczny problem przepustowości pamięci w przypadku generatywnej sztucznej inteligencji.

Cerebras wprowadza najszybszą na świecie technologię wnioskowania AI, 20 razy wydajniejszą niż NVIDIA

Cerebras Inference jest obecnie dostępny na następujących trzech poziomach:

  • Bezpłatny poziom oferuje darmowy dostęp do interfejsu API i duże limity użytkowania dla każdego, kto się zarejestruje.
  • Poziom Developer Tier jest przeznaczony do elastycznych wdrożeń bezserwerowych, oferując użytkownikom punkty końcowe API za ułamek kosztów istniejących alternatyw na rynku. Modele Llama 3.1 8B i 70B kosztują odpowiednio zaledwie 10 centów i 60 centów za milion tokenów.
  • Plany Enterprise Tier oferują precyzyjnie dostrojone modele, niestandardowe umowy o poziomie usług i dedykowane wsparcie. Rozwiązanie to idealnie nadaje się do obsługi stałych obciążeń. Przedsiębiorstwa mogą uzyskać dostęp do rozwiązania Cerebras Inference za pośrednictwem zarządzanej przez Cerebras prywatnej chmury lub lokalnie.

Dzięki rekordowej wydajności, konkurencyjnym cenom i otwartemu dostępowi do interfejsu API Cerebras Inference wyznacza nowy standard otwartego rozwoju i wdrażania LLM. Jako jedyne rozwiązanie umożliwiające zarówno szybkie szkolenie, jak i wnioskowanie, Cerebras otwiera zupełnie nowe możliwości dla sztucznej inteligencji.

Trendy w dziedzinie sztucznej inteligencji rozwijają się błyskawicznie, a firma NVIDIA ma obecnie dominującą pozycję na rynku, a pojawienie się takich firm jak Cerebras i Groq zwiastuje potencjalną zmianę dynamiki całej branży. W obliczu rosnącego zapotrzebowania na szybsze i tańsze rozwiązania do wnioskowania oparte na sztucznej inteligencji, rozwiązania takie jak Cerebras Inference są w dobrej pozycji, aby zaryzykować i zająć dominującą pozycję firmy NVIDIA, zwłaszcza w obszarze wnioskowania.

Sign up and earn $1000 a day ⋙

Leave a Comment

Różnica między zwykłym telewizorem a Smart TV

Różnica między zwykłym telewizorem a Smart TV

Telewizory Smart TV naprawdę podbiły świat. Dzięki tak wielu świetnym funkcjom i możliwościom połączenia z Internetem technologia zmieniła sposób, w jaki oglądamy telewizję.

Dlaczego zamrażarka nie ma światła, a lodówka tak?

Dlaczego zamrażarka nie ma światła, a lodówka tak?

Lodówki to powszechnie stosowane urządzenia gospodarstwa domowego. Lodówki zazwyczaj mają dwie komory: komora chłodna jest pojemna i posiada światło, które włącza się automatycznie po każdym otwarciu lodówki, natomiast komora zamrażarki jest wąska i nie posiada światła.

2 sposoby na naprawę przeciążenia sieci, które spowalnia sieć Wi-Fi

2 sposoby na naprawę przeciążenia sieci, które spowalnia sieć Wi-Fi

Na działanie sieci Wi-Fi wpływa wiele czynników poza routerami, przepustowością i zakłóceniami. Istnieje jednak kilka sprytnych sposobów na usprawnienie działania sieci.

Jak obniżyć wersję iOS 17 do iOS 16 bez utraty danych za pomocą Tenorshare Reiboot

Jak obniżyć wersję iOS 17 do iOS 16 bez utraty danych za pomocą Tenorshare Reiboot

Jeśli chcesz powrócić do stabilnej wersji iOS 16 na swoim telefonie, poniżej znajdziesz podstawowy przewodnik, jak odinstalować iOS 17 i obniżyć wersję iOS 17 do 16.

Co dzieje się z organizmem, gdy codziennie jesz jogurt?

Co dzieje się z organizmem, gdy codziennie jesz jogurt?

Jogurt jest wspaniałym produktem spożywczym. Czy warto jeść jogurt codziennie? Jak zmieni się Twoje ciało, gdy będziesz jeść jogurt codziennie? Przekonajmy się razem!

Który rodzaj ryżu jest najlepszy dla zdrowia?

Który rodzaj ryżu jest najlepszy dla zdrowia?

W tym artykule omówiono najbardziej odżywcze rodzaje ryżu i dowiesz się, jak zmaksymalizować korzyści zdrowotne, jakie daje wybrany przez Ciebie rodzaj ryżu.

Jak obudzić się rano na czas

Jak obudzić się rano na czas

Ustalenie harmonogramu snu i rutyny związanej z kładzeniem się spać, zmiana budzika i dostosowanie diety to niektóre z działań, które mogą pomóc Ci lepiej spać i budzić się rano o odpowiedniej porze.

Wskazówki dotyczące gry Rent Please! Symulator wynajmującego dla nowicjuszy

Wskazówki dotyczące gry Rent Please! Symulator wynajmującego dla nowicjuszy

Proszę o wynajem! Landlord Sim to mobilna gra symulacyjna dostępna na systemy iOS i Android. Wcielisz się w rolę właściciela kompleksu apartamentowego i wynajmiesz mieszkania, a Twoim celem jest odnowienie wnętrz apartamentów i przygotowanie ich na przyjęcie najemców.

Najnowsze kody do obrony wieży łazienkowej i jak je wprowadzać

Najnowsze kody do obrony wieży łazienkowej i jak je wprowadzać

Zdobądź kod do gry Bathroom Tower Defense Roblox i wymień go na atrakcyjne nagrody. Pomogą ci ulepszyć lub odblokować wieże zadające większe obrażenia.

Budowa, symbole i zasady działania transformatorów

Budowa, symbole i zasady działania transformatorów

Poznajmy budowę, symbole i zasady działania transformatorów w jak najbardziej dokładny spos��b.

4 sposoby, w jakie sztuczna inteligencja ulepsza inteligentne telewizory

4 sposoby, w jakie sztuczna inteligencja ulepsza inteligentne telewizory

Od lepszej jakości obrazu i dźwięku po sterowanie głosowe i wiele więcej — te funkcje oparte na sztucznej inteligencji sprawiają, że inteligentne telewizory stają się o wiele lepsze!

Dlaczego ChatGPT jest lepszy niż DeepSeek

Dlaczego ChatGPT jest lepszy niż DeepSeek

Początkowo ludzie wiązali duże nadzieje z DeepSeek. Jako chatbot oparty na sztucznej inteligencji, reklamowany jako silny konkurent ChatGPT, obiecuje inteligentne możliwości i doświadczenia związane z czatem.

Poznaj Fireflies.ai: darmową sekretarkę AI, która zaoszczędzi Ci godzin pracy

Poznaj Fireflies.ai: darmową sekretarkę AI, która zaoszczędzi Ci godzin pracy

Łatwo jest przegapić ważne szczegóły podczas zapisywania innych istotnych informacji, a próba robienia notatek podczas rozmowy może być rozpraszająca. Rozwiązaniem jest Fireflies.ai.

Jak hodować aksolotla w Minecraft, oswoić salamandrę w Minecraft

Jak hodować aksolotla w Minecraft, oswoić salamandrę w Minecraft

Axolot Minecraft będzie świetnym pomocnikiem dla graczy operujących pod wodą, jeśli tylko będą umieli się nim posługiwać.

Konfiguracja gry A Quiet Place: The Road Ahead na PC

Konfiguracja gry A Quiet Place: The Road Ahead na PC

Konfiguracja gry A Quiet Place: The Road Ahead została oceniona dość wysoko, dlatego też przed podjęciem decyzji o pobraniu należy wziąć ją pod uwagę.