W zeszłym miesiącu OpenAI wydało znaczącą aktualizację funkcji generowania obrazów ChatGPT, opartą na nowym modelu. Ta aktualizacja podbiła serca 130 milionów użytkowników na całym świecie i w ciągu zaledwie tygodnia od jej udostępnienia utworzono ponad 700 milionów obrazów.
Firma OpenAI oficjalnie udostępnia dziś udoskonalony model generowania obrazów deweloperom za pośrednictwem interfejsu API gpt-image-1. Nowe API umożliwia aplikacjom i usługom integrację tworzenia wysokiej jakości obrazów, obsługę różnych stylów wizualnych, precyzyjną edycję obrazów, bogatą wiedzę o świecie i wyraźne renderowanie tekstu.
gpt-image-1 jest już dostępny w interfejsie Images API, a wkrótce planowane jest wprowadzenie obsługi interfejsu Responses API.
Elastyczne funkcje sterowania:
- Moderacja : Programiści mogą dostosować wrażliwość moderacji za pomocą parametru moderacji. Domyślnie stosowany jest filtr standardowy, ale można wybrać tryb niski, aby zmniejszyć ograniczenie.
- Dostosowywanie wyników : Kontroluj jakość obrazu, liczbę generowanych obrazów, przezroczyste/nieprzezroczyste tło i format wyjściowy (JPEG, PNG, WebP).
Jest to płatna subskrypcja, a jej koszt jest oparty na tokenach, a poszczególne kamienie milowe są następujące:
- Wprowadzanie tekstu : 5 USD/1 milion tokenów.
- Wejście obrazu : 10 USD/1 milion tokenów.
- Wydajność obrazu : 40 USD/1 milion tokenów.
Przykład z życia wzięty: Każde kwadratowe zdjęcie o niskiej, średniej i wysokiej jakości kosztuje odpowiednio około 0,02, 0,04 i 0,19 dolara.
Programiści mogą wypróbować ten model na platformie OpenAI Playground. Wiele firm, m.in. Adobe, Airtable, Figma, Gamma, HeyGen, Wix, Photoroom, Canva, GoDaddy, HubSpot, Instacart, Invideo i OpusClip, zintegrowało interfejs API OpenAI do generowania zdjęć ze swoimi produktami i otrzymało pozytywne opinie od społeczności użytkowników.