Foxconn ogłasza udoskonalony model języka dużego (LLM) na podstawie Llama 3.1 firmy Meta

Foxconn, firma najbardziej znana z produkcji iPhone'ów i innych produktów sprzętowych Apple, właśnie zaskoczyła wszystkich, ogłaszając swój pierwszy duży model językowy (LLM) zwany FoxBrain, który ma służyć do usprawnienia produkcji i zarządzania łańcuchem dostaw.

Tajwański producent twierdzi, że FoxBrain został wytrenowany przy użyciu zaledwie 120 procesorów graficznych Nvidia H100. Niniejszy LLM został w zasadzie opracowany na podstawie architektury Llama 3.1 firmy Meta, z 70 miliardami parametrów uzyskanych w wyniku destylacji. Koncepcja udoskonalenia LLM polega na wykorzystaniu modelu „nadrzędnego” i wytrenowaniu modelu „podrzędnego” w oparciu o jego odpowiedzi. Firma Foxconn przyznała również, że ich LLM nie dorównuje udoskonalonemu modelowi DeepSeek (Chiny), ale ogólna wydajność jest bardzo bliska światowym standardom.

Mówiąc o tym osiągnięciu, dr Yung-Hui Li, dyrektor Centrum Badań nad Sztuczną Inteligencją w Instytucie Badawczym Hon Hai (Foxconn), powiedział:

W ostatnich miesiącach rozwijanie zdolności rozumowania i efektywne wykorzystanie procesorów graficznych stopniowo stało się głównym trendem w dziedzinie sztucznej inteligencji. Nasz model FoxBrain przyjął bardzo skuteczną strategię szkoleniową, skupiając się na optymalizacji procesu szkoleniowego zamiast na bezmyślnym gromadzeniu mocy obliczeniowej.

Dzięki starannie zaprojektowanym metodom szkoleniowym i optymalizacji zasobów udało nam się zbudować lokalny model AI z silnymi możliwościami rozumowania.

Foxconn ogłasza udoskonalony model języka dużego (LLM) na podstawie Llama 3.1 firmy Meta

Foxconn nie tylko składa produkty Apple, ale również produkuje serwery AI dla firmy Nvidia. FoxBrain, wraz ze 120 procesorami graficznymi H100, jest skalowany przy użyciu sieci Quantum-2 InfiniBand firmy Nvidia, a szkolenie trwa zaledwie około 4 tygodni (przy całkowitym koszcie obliczeniowym wynoszącym 2688 dni GPU). Firma Foxconn wygenerowała 98 miliardów wysokiej jakości tokenów danych przedtreningowych w języku chińskim tradycyjnym, przy czym długość okna kontekstowego wynosiła do 128 000 tokenów.

Partnerstwo między Foxconnem i Nvidią nie jest niczym nowym, a obie firmy pracują również nad innymi projektami, w tym nad budową największego na świecie zakładu produkującego procesory graficzne Blackwell.

Nvidia udostępniła firmie Foxconn również superkomputer Taipei-1, który umożliwił ukończenie procesu wstępnego trenowania modelu. Firma Foxconn poinformowała, że ​​FoxBrain stanie się „kluczowym silnikiem” do modernizacji trzech głównych platform firmy: inteligentnej produkcji, inteligentnych pojazdów elektrycznych i inteligentnych miast.

Sign up and earn $1000 a day ⋙

Leave a Comment

Jak dodać Copilot do Microsoft Office 365

Jak dodać Copilot do Microsoft Office 365

Copilot Pro integruje Copilot AI bezpośrednio z aplikacjami pakietu Microsoft 365, takimi jak Word, PowerPoint, Excel, OneNote i Outlook.

Jak stworzyć autoportret za pomocą Midjourney

Jak stworzyć autoportret za pomocą Midjourney

Generatory grafiki oparte na sztucznej inteligencji, takie jak Midjourney, potrafią odmienić Twoje obrazy, nadając im inny styl, tło, kolor i nastrój. Skorzystaj z tego samouczka, aby stworzyć kilka pomysłowych autoportretów widzianych oczami sztucznej inteligencji.

Oczekuje się gwałtownego wzrostu cen układów scalonych 2 nm

Oczekuje się gwałtownego wzrostu cen układów scalonych 2 nm

Według doniesień TSMC zaczęło przyjmować zamówienia na 2-nanometrowe wafle już na początku tego miesiąca. Szacuje się, że cena za jedną wafel wyniesie do 30 tys. dolarów.

OpenAI ma zamiar przejąć Windsurf – jeden z najpotężniejszych na świecie edytorów kodu AI

OpenAI ma zamiar przejąć Windsurf – jeden z najpotężniejszych na świecie edytorów kodu AI

OpenAI prowadzi rozmowy w sprawie przejęcia Windsurf, wiodącego w branży edytora kodu opartego na sztucznej inteligencji.

5 trendów w smartfonach, które należy wyeliminować

5 trendów w smartfonach, które należy wyeliminować

Niezależnie od tego, czy chodzi o niepraktyczne wybory projektowe, czy też funkcje, o które nikt tak naprawdę nie prosił, niektóre z tych trendów muszą zniknąć na zawsze.

Jak ukryć informacje kontaktowe na Instagramie

Jak ukryć informacje kontaktowe na Instagramie

Domyślnie Twoje dane kontaktowe pojawiają się na Twoim profilu na Instagramie. Będzie to miało wpływ na prywatność. Poniższy artykuł pokaże Ci, jak ukryć dane kontaktowe na Instagramie.

Jak zdalnie wylogować się z konta Telegram

Jak zdalnie wylogować się z konta Telegram

Aplikacja Telegram zapisze wszystkie urządzenia, na których zalogowano się do konta, na liście, którą będziemy mogli śledzić. Na podstawie tej listy możemy sprawdzić, czy nie doszło do nieautoryzowanych logowań.

Najnowszy kod Legendary World z 25.04.2025 i jak wykorzystać kod na nagrody

Najnowszy kod Legendary World z 25.04.2025 i jak wykorzystać kod na nagrody

W Legendary World gracze otrzymują serię diamentów, skrzyń ze skarbami i fragmentów postaci wysokiego poziomu za pośrednictwem kodu podarunkowego

Czym jest Google Store? Co znajdziesz w Google Store?

Czym jest Google Store? Co znajdziesz w Google Store?

Sklep Google ma ciekawą historię.

Jak usunąć adware z komputera

Jak usunąć adware z komputera

Kwestie bezpieczeństwa i prywatności należy zawsze traktować poważnie. W końcu są one ściśle związane z Twoim życiem, więc zachowaj szczególną czujność, jeśli chodzi o złośliwe oprogramowanie i inne zagrożenia.

Jak naprawić błąd IPv4/IPv6 Brak dostępu do Internetu w systemie Windows

Jak naprawić błąd IPv4/IPv6 Brak dostępu do Internetu w systemie Windows

W tym przewodniku Quantrimang.com przedstawi kilka kroków rozwiązywania problemów, które pomogą Ci rozwiązać błąd braku dostępu do Internetu w protokole IPv4/IPv6 i przywrócić połączenie internetowe.

Nvidia spodziewa się, że złącza zasilania RTX 5090/5080 nie stopią się dzięki nowej technologii wtyczek PCIe

Nvidia spodziewa się, że złącza zasilania RTX 5090/5080 nie stopią się dzięki nowej technologii wtyczek PCIe

Z pewnością wiele osób wciąż nie zapomniało skandalu związanego z „eksplozją” kart graficznych Nvidia RTX serii 40.

Dlaczego użytkownicy są rozczarowani linią produktów Galaxy S25 firmy Samsung

Dlaczego użytkownicy są rozczarowani linią produktów Galaxy S25 firmy Samsung

Wiele osób z niecierpliwością czekało na to, co Samsung zaproponuje w serii Galaxy S25, ale po zobaczeniu wszystkiego, co firma ma do zaoferowania, nie mogli oprzeć się poczuciu rozczarowania. Tegoroczna aktualizacja nie wprowadza zbyt wielu zmian.

Naukowcy obserwują niezwykle rzadkie zjawisko pochłonięcia planety przez gwiazdę.

Naukowcy obserwują niezwykle rzadkie zjawisko pochłonięcia planety przez gwiazdę.

Tego typu zjawisko zdarza się niezwykle rzadko, ale zespół ma nadzieję, że dzięki uruchomieniu JWST i innych zaawansowanych obserwatoriów uda się je zaobserwować częściej.

Jak zidentyfikować nory węży w ogrodzie

Jak zidentyfikować nory węży w ogrodzie

Węże nie kopią własnych nor, ale nie oznacza to, że nie mogą szukać schronienia w norach wykopanych przez coś innego. Oto jak rozpoznać i pozbyć się nory węży w ogrodzie.