OpenAI właśnie ogłosiło Program Pionierów – inicjatywę mającą na celu promowanie zastosowań sztucznej inteligencji w sytuacjach z życia wziętych. Program koncentruje się na udoskonaleniu sposobu oceny modeli sztucznej inteligencji, ponieważ programiści i przedsiębiorstwa coraz częściej polegają na testach porównawczych przy wyborze i optymalizacji odpowiednich modeli.
Decyzja ta została podjęta po oskarżeniach firmy Meta o manipulowanie testem porównawczym LMArena w celu zawyżenia pozycji modelu Llama 4. Celem programu Pioneers jest współpraca z firmami i badaczami OpenAI w celu opracowania standardów oceniania, które odzwierciedlają rzeczywiste wyzwania, a nie tylko rywalizację o wyniki w tabeli wyników.
Według OpenAI wybrane firmy otrzymają bezpośrednie wsparcie od swoich zespołów badawczych, skupiające się na dwóch głównych celach:
- Utwórz punkty odniesienia dla każdej dziedziny : Opracuj oddzielne metody oceny dla każdej dziedziny (prawo, finanse, medycyna, ubezpieczenia, rachunkowość).
- Dopracuj szkolenie modelu : Twórz zaawansowane modele sztucznej inteligencji, które obejmują trzy najważniejsze przypadki użycia biznesowego.
OpenAI podkreśla, że obecnie nie ma wspólnego standardu pomiaru wydajności sztucznej inteligencji w wielu z tych obszarów, co utrudnia sprawiedliwą ocenę i udoskonalanie modeli. Pracując bezpośrednio, firma ma nadzieję jasno zdefiniować, „co jest skuteczne” w każdej branży, i opublikować te kryteria, aby społeczność mogła je stosować.
W zakresie dostrajania modeli uczestniczące firmy otrzymają wsparcie w zakresie szkolenia niestandardowych wersji sztucznej inteligencji przy użyciu metody Reinforcement Fine-Tuning (RFT) – metody OpenAI służącej do tworzenia „eksperckich” modeli, które doskonale sprawdzają się w wąskich zestawach zadań. Modele te są z założenia gotowe do wdrożenia na skalę produkcyjną.
Jeśli chodzi o plan wdrożenia, pierwsza faza będzie koncentrować się głównie na grupie startupów wybranych na podstawie rzeczywistego wpływu produktu. OpenAI priorytetowo traktuje zespoły zajmujące się rozwiązywaniem konkretnych problemów, w których głęboka sztuczna inteligencja może przynieść wymierne korzyści. Wraz z tym w przyszłości planujemy rozszerzyć działalność na duże przedsiębiorstwa i bardziej złożone obszary.