Sztuczna inteligencja uczy się oszukiwać ludzi, mimo że została wyszkolona, ​​aby być uczciwą

Wiele czołowych SI, mimo że szkolono je, aby były uczciwe, w toku szkoleń uczy się oszukiwać i „systematycznie wpajać użytkownikom fałszywe przekonania” – wynika z nowego badania.

Zespołem badawczym kierował dr Peter S. Park, student studiów podyplomowych na kierunku przetrwanie i bezpieczeństwo sztucznej inteligencji w Massachusetts Institute of Technology (MIT), oraz cztery inne osoby. Podczas badań zespół korzystał także z porad wielu ekspertów, a jednym z nich był Geoffrey Hinton – jeden z twórców dziedziny sztucznej inteligencji.

Sztuczna inteligencja uczy się oszukiwać ludzi, mimo że została wyszkolona, ​​aby być uczciwą
Ilustracja: Średnia.

Badania koncentrowały się na dwóch systemach sztucznej inteligencji: systemie ogólnego przeznaczenia, wytrenowanym do wykonywania wielu zadań, takim jak GPT-4 firmy OpenAI ; oraz systemy zaprojektowane specjalnie do wykonywania określonego zadania, jak Cicero firmy Meta.

Jak powiedział pan Park, te systemy sztucznej inteligencji są szkolone, aby działać uczciwie, ale w trakcie szkolenia często uczą się oszukańczych sztuczek, aby wykonywać zadania.

Badania wykazały, że systemy sztucznej inteligencji szkolone w celu „wygrywania gier z elementem społecznym” są szczególnie podatne na oszustwa.

Na przykład zespół spróbował użyć Cicerona wyszkolonego w Meta do gry w Dyplomację, klasycznej grze strategicznej, w której gracze muszą tworzyć sojusze dla siebie i rozbijać sojusze rywali. W rezultacie ta sztuczna inteligencja często zdradza sojuszników i kłamie w żywe oczy.

Eksperymenty z GPT-4 wykazały, że narzędzie OpenAI skutecznie zdołało „zmanipulować psychologicznie” pracownika TaskRabbit, firmy świadczącej usługi sprzątania domów i montażu mebli, poprzez stwierdzenie, że jest on człowiekiem i potrzebuje pomocy w przejściu kodu Captcha, powołując się na poważne upośledzenie wzroku. Ten pracownik pomógł sztucznej inteligencji OpenAI „przekroczyć granicę” pomimo wcześniejszych wątpliwości.

Zespół Parka powołał się na badania firmy Anthropic, stojącej za Claude AI, które wykazały, że gdy duży model językowy (LLM) nauczy się oszukiwać, bezpieczne metody szkolenia stają się bezużyteczne i „trudne do odwrócenia”. Grupa uważa, że ​​jest to niepokojący problem w dziedzinie sztucznej inteligencji.

Wyniki badań zespołu opublikowano w Cell Press – zbiorze najważniejszych interdyscyplinarnych raportów naukowych.

Meta i OpenAI nie skomentowały wyników tych badań.

Obawiając się, że systemy sztucznej inteligencji mogą stwarzać poważne zagrożenia, zespół zaapelował również do decydentów o wprowadzenie surowszych przepisów dotyczących sztucznej inteligencji.

Zespół badawczy uważa, że ​​konieczne są regulacje dotyczące sztucznej inteligencji, modele wykazujące zachowania oszukańcze muszą spełniać wymogi oceny ryzyka, a systemy sztucznej inteligencji i ich wyniki muszą być ściśle kontrolowane. W razie potrzeby może zaistnieć konieczność usunięcia wszystkich danych i ponownego ich przeszkolenia od podstaw.

kto, kto oszukuje, kto oszukuje ludzi

Zostaw komentarz

Jak naprawić błąd logowania internetowego w aplikacji Microsoft Teams

Jak naprawić błąd logowania internetowego w aplikacji Microsoft Teams

Masz problem z logowaniem przez Internet w Microsoft Teams? Uzyskaj natychmiastowe rozwiązania typowych problemów, takich jak „Coś poszło nie tak” lub „Logowanie się zapętla”. Przewodnik krok po kroku, jak rozwiązać problemy z logowaniem przez Internet w Teams i zachować produktywność. Zaktualizowano o najnowsze poprawki przeglądarki.

Jak naprawić błąd w samouczku dotyczącym przewodnika Microsoft Teams

Jak naprawić błąd w samouczku dotyczącym przewodnika Microsoft Teams

Masz problem z błędem w samouczku Microsoft Teams? Odkryj proste rozwiązania krok po kroku, aby szybko go rozwiązać. Wyczyść pamięć podręczną, zaktualizuj i wiele więcej, aby zapewnić płynną pracę zespołową. Zaktualizowano do najnowszych wersji!

Jak naprawić błędy odtwarzania multimediów w aplikacji Microsoft Teams w 2026 roku

Jak naprawić błędy odtwarzania multimediów w aplikacji Microsoft Teams w 2026 roku

Masz dość błędów odtwarzania multimediów w Microsoft Teams, które psują Twoje spotkania w 2026 roku? Skorzystaj z naszego eksperckiego przewodnika krok po kroku, aby szybko naprawić błędy dźwięku, obrazu i udostępniania – bez konieczności posiadania umiejętności technicznych. Bezproblemowa współpraca czeka!

Rozwiązywanie problemów z ustawieniami serwera proxy w usłudze Microsoft Teams

Rozwiązywanie problemów z ustawieniami serwera proxy w usłudze Microsoft Teams

Masz problem z błędem proxy w Microsoft Teams? Poznaj sprawdzone sposoby rozwiązywania problemów z ustawieniami proxy w Microsoft Teams. Wyczyść pamięć podręczną, dostosuj ustawienia proxy i wróć do płynnych połączeń w kilka minut dzięki naszemu przewodnikowi eksperta.

Rozwiązywanie problemów z pętlą uruchamiania ekranu powitalnego w aplikacji Microsoft Teams

Rozwiązywanie problemów z pętlą uruchamiania ekranu powitalnego w aplikacji Microsoft Teams

Frustruje Cię pętla uruchamiania ekranu powitalnego w Microsoft Teams? Postępuj zgodnie ze sprawdzonymi krokami rozwiązywania problemów z pętlą uruchamiania ekranu powitalnego w Microsoft Teams: wyczyść pamięć podręczną, zresetuj aplikację, zainstaluj ponownie. Wróć do płynnej współpracy w kilka minut!

Dlaczego nie widzę pokoi podgrup na spotkaniu w aplikacji Teams?

Dlaczego nie widzę pokoi podgrup na spotkaniu w aplikacji Teams?

Frustruje Cię brak pokoi spotkań w Teams? Odkryj najczęstsze powody, dla których nie widzisz pokoi spotkań w Teams i postępuj zgodnie z naszymi krok po kroku, aby w kilka minut uruchomić je płynnie. Idealne rozwiązanie zarówno dla organizatorów, jak i uczestników!

Rozwiązywanie problemów z błędami w aplikacji Microsoft Teams: co należy sprawdzić w pierwszej kolejności

Rozwiązywanie problemów z błędami w aplikacji Microsoft Teams: co należy sprawdzić w pierwszej kolejności

Napotkałeś dziś błąd w Microsoft Teams? Ten przewodnik krok po kroku dotyczący rozwiązywania problemów z Microsoft Teams ujawnia pierwsze kroki, które pozwolą szybko go rozwiązać. Szybkie poprawki dotyczące łączności, pamięci podręcznej i aktualizacji, które pozwolą Ci bezproblemowo wrócić do czatowania.

Dlaczego w moim programie Outlook brakuje dodatku Microsoft Teams?

Dlaczego w moim programie Outlook brakuje dodatku Microsoft Teams?

Frustruje Cię brak dodatku Microsoft Teams w Outlooku? Odkryj najważniejsze przyczyny i proste rozwiązania krok po kroku, aby bezproblemowo przywrócić płynną integrację Teams z Outlookiem. Działa z najnowszymi wersjami!

Gdzie znajdują się klucze rejestru aplikacji Microsoft Teams w systemie Windows 11?

Gdzie znajdują się klucze rejestru aplikacji Microsoft Teams w systemie Windows 11?

Odblokuj dokładne lokalizacje kluczy rejestru Microsoft Teams w systemie Windows 11. Przewodnik krok po kroku, jak je znaleźć, uzyskać do nich dostęp i bezpiecznie je modyfikować, aby zapewnić optymalną wydajność i rozwiązywać problemy. Niezbędny dla specjalistów IT i entuzjastów Teams.

Rozwiązywanie problemów ze skrótem klawiaturowym i awariami podczas uruchamiania aplikacji Microsoft Teams

Rozwiązywanie problemów ze skrótem klawiaturowym i awariami podczas uruchamiania aplikacji Microsoft Teams

Masz dość błędów skrótów w Microsoft Teams, które blokują Twój przepływ pracy? Poznaj sprawdzone sposoby na rozwiązanie błędów skrótów i awarii uruchamiania Microsoft Teams, aby zapewnić płynną współpracę. Szybkie i proste rozwiązania w pakiecie!