Gemma 2 czy Llama 3 to najlepszy model open source?

Podczas konferencji I/O 2024 firma Google zapowiedziała nową linię modeli Gemma 2, a teraz firma wreszcie udostępnia lekkie modele na licencji open source. Mówi się, że nowy model Gemma 2 27B jest bardzo obiecujący i przewyższa niektóre większe modele, takie jak Llama 3 70B i Qwen 1.5 32B. Aby przetestować to stwierdzenie, porównajmy Gemmę 2 i Llamę 3 — dwa najlepsze obecnie modele open source.

Pisanie kreatywne

Najpierw sprawdźmy, jak dobrze Gemma 2 i Llama 3 sprawdzają się w pisaniu kreatywnym. Autor artykułu poprosił obie modelki o napisanie krótkiego opowiadania na temat relacji między Księżycem i Słońcem. Oba modele radzą sobie świetnie, ale model Gemma 2 firmy Google wyróżnia się wciągającą prozą i dobrą historią.

Gemma 2 czy Llama 3 to najlepszy model open source?
Gemma 2 czy Llama 3 to najlepszy model open source?

Z drugiej strony Llama 3 wygląda nieco nudno i mechanicznie. Google zawsze dobrze radziło sobie z generowaniem tekstu za pomocą modeli Gemini i mniejszy Gemma 2 27B nie jest tu wyjątkiem.

Opcja wygrywająca: Gemma 2

Testowanie wielojęzyczne

W następnej rundzie sprawdzimy, jak oba modele radzą sobie z językami innymi niż angielski. Ponieważ Google reklamuje Gemma 2 jako program dobrze rozumiejący wiele języków, autor porównał go do modelu Llama 3 firmy Meta. Autor poprosił obie modelki o przetłumaczenie fragmentu na język hindi. Zarówno Gemma 2 jak i Llama 3 wypadły bardzo dobrze.

Gemma 2 czy Llama 3 to najlepszy model open source?
Gemma 2 czy Llama 3 to najlepszy model open source?

Autor wypróbował również inny język, bengalski, a modele dały podobnie dobre wyniki. Przynajmniej w przypadku języków indyjskich można stwierdzić, że Gemma 2 i Llama 3 są dobrze wyćwiczone w oparciu o duży korpus. Jednak Gemma 2 27B jest prawie 2,5 razy mniejsza od Llama 3 70B, co czyni ją jeszcze bardziej imponującą.

Opcje wygranej: Gemma 2 i Llama 3

Sprawdź logikę

Mimo że Gemma 2 i Llama 3 nie są najinteligentniejszymi modelami na rynku, mogą wykonywać niektóre typowe testy rozumowania tak samo jak znacznie większe modele. W poprzednim porównaniu Llama 3 i GPT-4 model 70B firmy Meta zrobił wrażenie, wykazując się całkiem dobrą inteligencją, nawet przy swoich mniejszych rozmiarach.

Gemma 2 czy Llama 3 to najlepszy model open source?
Gemma 2 czy Llama 3 to najlepszy model open source?

W tej rundzie Llama 3 pokonała Gemmę 2 dużą różnicą punktów. Llama 3 odpowiedziała poprawnie na 2 z 3 pytań, natomiast Gemma 2 miała problem z odpowiedzią choćby na jedno. Gemma 2 po prostu nie jest wyszkolona w rozwiązywaniu złożonych problemów logicznych.

Z drugiej strony Llama 3 opiera się na solidnych podstawach logicznych, co najprawdopodobniej można wywnioskować z zaszyfrowanego zbioru danych. Pomimo niewielkich rozmiarów — przynajmniej w porównaniu do modeli o bilionach parametrów, takich jak GPT-4 — wykazuje on więcej niż przyzwoity poziom inteligencji. Ostatecznie użycie większej liczby tokenów do trenowania modelu faktycznie skutkuje powstaniem wydajniejszego modelu.

Opcja wygrywająca: Lama 3

Postępuj zgodnie z instrukcjami

W kolejnej rundzie autor poprosił Gemmę 2 i Lamę 3 o stworzenie 10 słów kończących się na „NPU”. A Llama 3 dostała 10/10 poprawnych odpowiedzi. Natomiast Gemma 2 wygenerowała tylko 7 poprawnych zdań na 10. W wielu poprzednich wersjach modele Google, w tym Gemini, nie radziły sobie dobrze z instrukcjami użytkowników. Ta sama tendencja jest widoczna w Gemmie 2.

Gemma 2 czy Llama 3 to najlepszy model open source?
Gemma 2 czy Llama 3 to najlepszy model open source?

Przestrzeganie instrukcji użytkownika ma kluczowe znaczenie dla modeli sztucznej inteligencji. Gwarantuje niezawodność i generuje dokładne informacje zwrotne na temat podanych instrukcji. Z punktu widzenia bezpieczeństwa pomaga to również utrzymać model w ryzach, co przekłada się na lepszą zgodność z protokołami bezpieczeństwa.

Opcja wygrywająca: Lama 3

Znajdź informacje

Zarówno Gemma 2, jak i Llama 3 mają długość kontekstu wynoszącą 8 tys. tokenów. Autor dodał ogromny blok tekstu, pochodzący bezpośrednio z książki Duma i uprzedzenie, zawierający ponad 17 000 znaków i 3,8 tys. tokenów. Jak zwykle autor umieszcza gdzieś w tekście przypadkowy cytat i prosi obie modelki o jego odnalezienie.

Gemma 2 czy Llama 3 to najlepszy model open source?

Gemma 2 szybko zrozumiała informację i zauważyła, że ​​cytat został wstawiony losowo. Llama 3 również uznała i zasugerowała, że ​​takie twierdzenie wydaje się nie na miejscu. Jeśli chodzi o pamięć kontekstową o dużej pojemności, chociaż ograniczoną do tokenów 8K, oba modele są pod tym względem dość mocne.

Należy zauważyć, że autor przeprowadził ten test na HuggingChat (sieć), ponieważ meta.ai odmówiło uruchomienia tego monitu, najprawdopodobniej z powodu treści objętych prawami autorskimi.

Opcje wygranej: Gemma 2 i Llama 3

Sprawdź, czy masz halucynacje

Mniejsze modele mają tendencję do występowania halucynacji sztucznej inteligencji (AI) ze względu na ograniczoną ilość danych szkoleniowych i często zmyślają informacje, gdy model napotyka nieznane mu tematy. Autor dodał więc wymyśloną przez siebie nazwę kraju, żeby sprawdzić, czy Gemma 2 i Llama 3 mają halucynacje. I co zaskakujące, tego nie zrobili, co oznacza, że ​​zarówno Google, jak i Meta mają całkiem solidne podstawy dla swoich modeli.

Gemma 2 czy Llama 3 to najlepszy model open source?
Gemma 2 czy Llama 3 to najlepszy model open source?
Gemma 2 czy Llama 3 to najlepszy model open source?

Autor zadał jeszcze jedno (fałszywe) pytanie, aby sprawdzić wiarygodność modeli, ale ponownie nie miały one charakteru halucynogennego. Nawiasem mówiąc, autor testował Llamę 3 na HuggingChat, podczas gdy meta.ai przeglądał Internet w poszukiwaniu bieżących informacji na istotne tematy.

Opcje wygranej: Gemma 2 i Llama 3

Zakończyć

Mimo że model Gemma 2 27B firmy Google nie radzi sobie najlepiej z testami rozumowania, jest w stanie poradzić sobie z wieloma innymi zadaniami. Świetnie nadaje się do kreatywnego pisania, obsługuje wiele języków, ma dobrą pamięć i, co najważniejsze, nie jest tak halucynogenny jak poprzednie modele.

Llama 3 jest oczywiście lepsza, ale to też znacznie większy model, wytrenowany na podstawie 70 miliardów parametrów. Deweloperzy uznają model Gemma 2 27B za przydatny w wielu zastosowaniach. A dla pewności, dostępny jest również model Gemma 2 9B.

Dodatkowo użytkownicy powinni sprawdzić Gemini 1.5 Flash, który jest znacznie mniejszym modelem, a także obsługuje wprowadzanie danych multimodalnych. Nie wspominając już o tym, że jest niesamowicie szybki i wydajny.

Sign up and earn $1000 a day ⋙

Leave a Comment

Różnica między zwykłym telewizorem a Smart TV

Różnica między zwykłym telewizorem a Smart TV

Telewizory Smart TV naprawdę podbiły świat. Dzięki tak wielu świetnym funkcjom i możliwościom połączenia z Internetem technologia zmieniła sposób, w jaki oglądamy telewizję.

Dlaczego zamrażarka nie ma światła, a lodówka tak?

Dlaczego zamrażarka nie ma światła, a lodówka tak?

Lodówki to powszechnie stosowane urządzenia gospodarstwa domowego. Lodówki zazwyczaj mają dwie komory: komora chłodna jest pojemna i posiada światło, które włącza się automatycznie po każdym otwarciu lodówki, natomiast komora zamrażarki jest wąska i nie posiada światła.

2 sposoby na naprawę przeciążenia sieci, które spowalnia sieć Wi-Fi

2 sposoby na naprawę przeciążenia sieci, które spowalnia sieć Wi-Fi

Na działanie sieci Wi-Fi wpływa wiele czynników poza routerami, przepustowością i zakłóceniami. Istnieje jednak kilka sprytnych sposobów na usprawnienie działania sieci.

Jak obniżyć wersję iOS 17 do iOS 16 bez utraty danych za pomocą Tenorshare Reiboot

Jak obniżyć wersję iOS 17 do iOS 16 bez utraty danych za pomocą Tenorshare Reiboot

Jeśli chcesz powrócić do stabilnej wersji iOS 16 na swoim telefonie, poniżej znajdziesz podstawowy przewodnik, jak odinstalować iOS 17 i obniżyć wersję iOS 17 do 16.

Co dzieje się z organizmem, gdy codziennie jesz jogurt?

Co dzieje się z organizmem, gdy codziennie jesz jogurt?

Jogurt jest wspaniałym produktem spożywczym. Czy warto jeść jogurt codziennie? Jak zmieni się Twoje ciało, gdy będziesz jeść jogurt codziennie? Przekonajmy się razem!

Który rodzaj ryżu jest najlepszy dla zdrowia?

Który rodzaj ryżu jest najlepszy dla zdrowia?

W tym artykule omówiono najbardziej odżywcze rodzaje ryżu i dowiesz się, jak zmaksymalizować korzyści zdrowotne, jakie daje wybrany przez Ciebie rodzaj ryżu.

Jak obudzić się rano na czas

Jak obudzić się rano na czas

Ustalenie harmonogramu snu i rutyny związanej z kładzeniem się spać, zmiana budzika i dostosowanie diety to niektóre z działań, które mogą pomóc Ci lepiej spać i budzić się rano o odpowiedniej porze.

Wskazówki dotyczące gry Rent Please! Symulator wynajmującego dla nowicjuszy

Wskazówki dotyczące gry Rent Please! Symulator wynajmującego dla nowicjuszy

Proszę o wynajem! Landlord Sim to mobilna gra symulacyjna dostępna na systemy iOS i Android. Wcielisz się w rolę właściciela kompleksu apartamentowego i wynajmiesz mieszkania, a Twoim celem jest odnowienie wnętrz apartamentów i przygotowanie ich na przyjęcie najemców.

Najnowsze kody do obrony wieży łazienkowej i jak je wprowadzać

Najnowsze kody do obrony wieży łazienkowej i jak je wprowadzać

Zdobądź kod do gry Bathroom Tower Defense Roblox i wymień go na atrakcyjne nagrody. Pomogą ci ulepszyć lub odblokować wieże zadające większe obrażenia.

Budowa, symbole i zasady działania transformatorów

Budowa, symbole i zasady działania transformatorów

Poznajmy budowę, symbole i zasady działania transformatorów w jak najbardziej dokładny spos��b.

4 sposoby, w jakie sztuczna inteligencja ulepsza inteligentne telewizory

4 sposoby, w jakie sztuczna inteligencja ulepsza inteligentne telewizory

Od lepszej jakości obrazu i dźwięku po sterowanie głosowe i wiele więcej — te funkcje oparte na sztucznej inteligencji sprawiają, że inteligentne telewizory stają się o wiele lepsze!

Dlaczego ChatGPT jest lepszy niż DeepSeek

Dlaczego ChatGPT jest lepszy niż DeepSeek

Początkowo ludzie wiązali duże nadzieje z DeepSeek. Jako chatbot oparty na sztucznej inteligencji, reklamowany jako silny konkurent ChatGPT, obiecuje inteligentne możliwości i doświadczenia związane z czatem.

Poznaj Fireflies.ai: darmową sekretarkę AI, która zaoszczędzi Ci godzin pracy

Poznaj Fireflies.ai: darmową sekretarkę AI, która zaoszczędzi Ci godzin pracy

Łatwo jest przegapić ważne szczegóły podczas zapisywania innych istotnych informacji, a próba robienia notatek podczas rozmowy może być rozpraszająca. Rozwiązaniem jest Fireflies.ai.

Jak hodować aksolotla w Minecraft, oswoić salamandrę w Minecraft

Jak hodować aksolotla w Minecraft, oswoić salamandrę w Minecraft

Axolot Minecraft będzie świetnym pomocnikiem dla graczy operujących pod wodą, jeśli tylko będą umieli się nim posługiwać.

Konfiguracja gry A Quiet Place: The Road Ahead na PC

Konfiguracja gry A Quiet Place: The Road Ahead na PC

Konfiguracja gry A Quiet Place: The Road Ahead została oceniona dość wysoko, dlatego też przed podjęciem decyzji o pobraniu należy wziąć ją pod uwagę.