Cerebras wprowadza najszybszą na świecie technologię wnioskowania AI, 20 razy wydajniejszą niż NVIDIA

Firma Cerebras Systems właśnie oficjalnie zaprezentowała rozwiązanie Cerebras Inference, uważane za najszybsze na świecie rozwiązanie do wnioskowania oparte na sztucznej inteligencji. Rozwiązanie Cerebras Inference zapewnia wydajność do 1800 tokenów na sekundę w przypadku modeli Llama 3.1 8B (8 miliardów parametrów) oraz 450 tokenów na sekundę w przypadku modeli Llama 3.1 70B, co jest wynikiem niemal 20-krotnie szybszym od rozwiązań do wnioskowania AI opartych na procesorach graficznych NVIDIA dostępnych w dzisiejszych chmurach hiperskalowych na całym świecie, w tym w Microsoft Azure.

Oprócz niesamowitej wydajności, cena usług tego nowego rozwiązania wnioskowania jest również bardzo niska, stanowiąc ułamek ceny popularnych platform chmurowych GPU. Na przykład klient może otrzymać milion tokenów za jedyne 10 centów, co zapewnia 100-krotnie lepszy stosunek ceny do jakości w przypadku obciążeń związanych ze sztuczną inteligencją.

16-bitowa precyzja i 20-krotnie szybsza prędkość wnioskowania Cerebras umożliwią programistom tworzenie wydajnych aplikacji AI nowej generacji bez uszczerbku dla szybkości i kosztów. Ten przełomowy stosunek ceny do wydajności jest możliwy dzięki systemowi Cerebras CS-3 i procesorowi AI Wafer Scale Engine 3 (WSE-3). CS-3 oferuje 7000 razy większą przepustowość pamięci niż Nvidia H100, rozwiązując tym samym techniczny problem przepustowości pamięci w przypadku generatywnej sztucznej inteligencji.

Cerebras wprowadza najszybszą na świecie technologię wnioskowania AI, 20 razy wydajniejszą niż NVIDIA

Cerebras Inference jest obecnie dostępny na następujących trzech poziomach:

  • Bezpłatny poziom oferuje darmowy dostęp do interfejsu API i duże limity użytkowania dla każdego, kto się zarejestruje.
  • Poziom Developer Tier jest przeznaczony do elastycznych wdrożeń bezserwerowych, oferując użytkownikom punkty końcowe API za ułamek kosztów istniejących alternatyw na rynku. Modele Llama 3.1 8B i 70B kosztują odpowiednio zaledwie 10 centów i 60 centów za milion tokenów.
  • Plany Enterprise Tier oferują precyzyjnie dostrojone modele, niestandardowe umowy o poziomie usług i dedykowane wsparcie. Rozwiązanie to idealnie nadaje się do obsługi stałych obciążeń. Przedsiębiorstwa mogą uzyskać dostęp do rozwiązania Cerebras Inference za pośrednictwem zarządzanej przez Cerebras prywatnej chmury lub lokalnie.

Dzięki rekordowej wydajności, konkurencyjnym cenom i otwartemu dostępowi do interfejsu API Cerebras Inference wyznacza nowy standard otwartego rozwoju i wdrażania LLM. Jako jedyne rozwiązanie umożliwiające zarówno szybkie szkolenie, jak i wnioskowanie, Cerebras otwiera zupełnie nowe możliwości dla sztucznej inteligencji.

Trendy w dziedzinie sztucznej inteligencji rozwijają się błyskawicznie, a firma NVIDIA ma obecnie dominującą pozycję na rynku, a pojawienie się takich firm jak Cerebras i Groq zwiastuje potencjalną zmianę dynamiki całej branży. W obliczu rosnącego zapotrzebowania na szybsze i tańsze rozwiązania do wnioskowania oparte na sztucznej inteligencji, rozwiązania takie jak Cerebras Inference są w dobrej pozycji, aby zaryzykować i zająć dominującą pozycję firmy NVIDIA, zwłaszcza w obszarze wnioskowania.

Sign up and earn $1000 a day ⋙

Leave a Comment

Najnowszy kod do gry House of Flying Daggers i jak go wykorzystać

Najnowszy kod do gry House of Flying Daggers i jak go wykorzystać

Code Thap Dien Mai Phuc daje graczom Kim Nguyen Bao, Hoan Khon Halo, Gold, Huyen Tinh, Huyen Tinh Chest

Black Myth: Wukong kradnie rekord Cyberpunk 2077

Black Myth: Wukong kradnie rekord Cyberpunk 2077

Biorąc pod uwagę większość pozytywnych recenzji, nie ma się co dziwić, że Black Myth: Wukong bije rekordy na Steamie.

Dowiedz się więcej o kodzie błędu 0xc00000e i jak go naprawić

Dowiedz się więcej o kodzie błędu 0xc00000e i jak go naprawić

Koszmarny niebieski ekran śmierci (BSOD) z kodem błędu 0xc00000e, który często pojawia się podczas uruchamiania systemu Windows 10, może być mylący.

Przestrzeń do wspólnej zabawy, nazwij przestrzeń

Przestrzeń do wspólnej zabawy, nazwij przestrzeń

Wiele osób używa spacji w nazwach swoich kont Play Together lub małych podkreślników, aby utworzyć odstępy między literami wpisanymi w nazwie.

Jak pobrać Black Beacon PC

Jak pobrać Black Beacon PC

Choć gra Black Beacon jest możliwa na komputerze PC, to w chwili obecnej nie jest ona oficjalnie zoptymalizowana pod kątem tej platformy.

Wzór na obliczenie powierzchni i objętości kuli

Wzór na obliczenie powierzchni i objętości kuli

Powierzchnia kuli jest czterokrotnie większa od powierzchni dużego koła, która jest czterokrotnie większa od stałej Pi pomnożonej przez kwadrat promienia kuli.

Co jest szczególnego w skafandrze kosmicznym, który Chiny wybrały na pierwsze załogowe lądowanie na Księżycu?

Co jest szczególnego w skafandrze kosmicznym, który Chiny wybrały na pierwsze załogowe lądowanie na Księżycu?

Chiny planują wysłać pierwszych obywateli na Księżyc do 2030 roku. Kraj ten właśnie zaprezentował nowy skafander kosmiczny, który zostanie wykorzystany w nadchodzącej historycznej misji.

Produkty spożywcze, które łatwo wywołują stany zapalne w organizmie

Produkty spożywcze, które łatwo wywołują stany zapalne w organizmie

Wiele produktów spożywczych może powodować stany zapalne i przewlekłe choroby. Poniżej znajdziesz listę produktów, których należy unikać w nadmiernych ilościach, jeśli nie chcesz sprowadzić na swój organizm choroby.

Instrukcje dotyczące gry w Zuka Lien Quan Mobile sezon S1 2023

Instrukcje dotyczące gry w Zuka Lien Quan Mobile sezon S1 2023

Zuka to zabójca, który jest postrachem bohaterów o niskim poziomie zdrowia. Dowiedz się, jak skutecznie używać Zuki w sezonie 23.

Najnowszy kod Heroic Era i jak go wykorzystać

Najnowszy kod Heroic Era i jak go wykorzystać

Prawie wszyscy nowi gracze, dołączając do gry, odbierają prezenty za pośrednictwem kodów podarunkowych Heroic Age.

8 najtańszych dostawców pamięci masowej w chmurze

8 najtańszych dostawców pamięci masowej w chmurze

Przyjrzyjmy się najtańszym opcjom przechowywania danych w chmurze, jakie są dostępne. W tym artykule przyjrzymy się cenom zarówno w wartościach bezwzględnych, jak i za gigabajt (za miesiąc), abyś mógł wybrać najlepszą dla siebie opcję.

Czym jest błąd znaku funta (####) w programie Excel?

Czym jest błąd znaku funta (####) w programie Excel?

#### w programie Excel to częsty błąd, który pojawia się w wielu różnych przypadkach, gdy wprowadzamy dane, funkcje i formuły do ​​programu Excel.

12 ustawień w telefonach Samsung Galaxy, które powinieneś zmienić

12 ustawień w telefonach Samsung Galaxy, które powinieneś zmienić

Właśnie kupiłeś telefon Samsung Galaxy i musisz go skonfigurować? Oto 10 ustawień, które warto zmienić, aby Twój telefon Samsung działał lepiej.

Najnowsze kody do gry Murder Mystery 2 i jak je wprowadzić

Najnowsze kody do gry Murder Mystery 2 i jak je wprowadzić

Code Murder Mystery 2 pozwala graczom wybierać więcej skórek noży dla swoich postaci lub zdobywać więcej pieniędzy na usługi i inne rzeczy w grze.

28 pięknych wzorów kartek urodzinowych z życzeniami dla rodziców, małżonków, kochanków, przyjaciół

28 pięknych wzorów kartek urodzinowych z życzeniami dla rodziców, małżonków, kochanków, przyjaciół

W dniu urodzin ukochanej osoby, rodziców, przyjaciół, rodzeństwa, współpracowników... oprócz prezentów nie zapomnij wysłać kartek urodzinowych z życzeniami.