DeepSeek, chińska firma stojąca za darmowym modelem sztucznej inteligencji, który wstrząsnął światem technologii, mierzy się z szeregiem negatywnych oskarżeń, m.in. o wykorzystywanie przemycanych procesorów graficznych Nvidia do trenowania i uruchamiania swojego modelu sztucznej inteligencji.
W związku z tym Departament Handlu USA rozważa zbadanie, czy DeepSeek nie uzyskał nielegalnego dostępu i nie gromadził danych o procesorach graficznych Nvidia za pośrednictwem pośredników w Singapurze. W ostatnich latach Stany Zjednoczone utrzymywały surowe ograniczenia w eksporcie zaawansowanych układów scalonych do Chin, chcąc utrzymać swoją wiodącą pozycję w dziedzinie technologii i powstrzymać szybki rozwój swego rywala.
Firma DeepSeek niedawno znalazła się na pierwszych stronach gazet za sprawą wydania swojego modelu wnioskowania R1. Mówi się, że ten model ma wydajność zbliżoną do modelu o1 firmy OpenAI, który dostępny jest wyłącznie w planie subskrypcji ChatGPT Pro, wymagającym płatnej subskrypcji. To, co sprawia, że DeepSeek jest tak cenny, to nie tylko fakt, że oferuje podobną wydajność, ale także to, że jest udostępniany jako oprogramowanie open source i darmowe dla każdego. Ci, którzy nigdy nie mieli okazji zapoznać się z najnowocześniejszym modelem wnioskowania OpenAI, teraz mogą skorzystać z DeepSeek R1 jako godnej uwagi alternatywy.
Aplikacja DeepSeek cieszyła się tak dużą popularnością, że dotarła do pierwszego miejsca na liście przebojów w amerykańskim App Store, co spowodowało gwałtowny spadek wartości amerykańskiego rynku akcji i utratę 2 bilionów dolarów kapitalizacji rynkowej w ciągu zaledwie kilku dni.
Co ciekawe, DeepSeek twierdzi, że dokonało tego wszystkiego, wykorzystując zaledwie 2000 procesorów graficznych Nvidia H800 i szacując koszty inwestycji wynoszące 6 milionów dolarów – jest to niewielka kwota w porównaniu z ogromnymi inwestycjami w OpenAI i wiele innych podobnych modeli AI.
Według Citigroup, amerykańscy giganci technologiczni, tacy jak Microsoft, Meta, Amazon i Alphabet, wydali w sumie około 209 miliardów dolarów na infrastrukturę danych w ubiegłym roku, z czego 80% przeznaczono na centra danych. Wiele osób zastanawia się, czy DeepSeek faktycznie robi coś innego niż OpenAI i inne amerykańskie firmy zajmujące się sztuczną inteligencją, a także czy rzeczywiście możliwe jest trenowanie modeli sztucznej inteligencji przy użyciu tak niewielu zasobów.

David Sacks, były urzędnik zajmujący się sztuczną inteligencją w rządzie prezydenta Donalda Trumpa, powiedział w niedawnym wywiadzie, że istnieją „istotne dowody” na to, że DeepSeek wykorzystał dane wyjściowe OpenAI do wytrenowania własnego modelu. Proces destylacji obejmuje „model podrzędny” (DeepSeek) naśladujący sposób rozumowania „modelu nadrzędnego” (OpenAI), podobnie jak ludzie uczą się, zadając miliony pytań. Microsoft i OpenAI również wszczęły własne dochodzenia w tej sprawie, przede wszystkim w celu wyjaśnienia, czy DeepSeek uzyskał dostęp do danych OpenAI w niewłaściwy sposób.
DeepSeek poinformowało, że wykorzystuje układ H800 — chipset AI opracowany przez firmę Nvidia specjalnie na rynek chiński po wprowadzeniu kontroli eksportu. Nie jest jasne, w jaki sposób DeepSeek nabył karty Nvidia H800, ale firma może je kupić pod koniec 2022 lub 2023 roku.
Obecnie nie ma dowodów na to, że DeepSeek korzystał z przemycanych układów scalonych. Mówi się jednak, że wiele chińskich firm zajmujących się sztuczną inteligencją tak właśnie postąpiło. Zorganizowany przemyt układów scalonych ze sztuczną inteligencją do Chin odnotowano w kilku krajach, w tym w Malezji, Singapurze i Zjednoczonych Emiratach Arabskich.