Niedawno OpenAI oficjalnie wypuściło na rynek GPT-OSS, nową rodzinę modeli językowych o otwartych wagach, bazującą na licencji Apache 2.0. Co ciekawe, składa się ona z dwóch wariantów: gpt-oss-120b oraz gpt-oss-20b. Modele te oferują elastyczność i dostępność oraz są odpowiedzią na rosnące zapotrzebowanie na bardziej otwarte rozwiązania w sektorze sztucznej inteligencji.
Co odróżnia GPT-OSS?
GPT-OSS wyróżnia się zastosowaniem mechanizmu mixture-of-experts (MoE), który polega na aktywowaniu tylko części parametrów podczas generowania tekstu. W przypadku większego modelu, gpt-oss-120b, każdorazowo aktywowane jest około 5.1 miliarda parametrów na token. To rozwiązanie pozwala efektywnie wykorzystywać zasoby sprzętowe, nie tracąc przy tym na jakości generowanego tekstu. Model ten, choć posiada aż 120 miliardów parametrów, może działać na pojedynczej karcie GPU o pamięci 80 GB. Z kolei mniejszy, gpt-oss-20b, został zaprojektowany z myślą o lokalnym użyciu na urządzeniach z pamięcią od około 16 GB, co sprawia, że jest idealny do szybkich testów i wdrożeń bez konieczności inwestowania w kosztowną infrastrukturę.
Pod względem funkcjonalności, oba modele nie ustępują zamkniętym rozwiązaniom. Posiadają silne zdolności w korzystaniu z narzędzi, obsługiwaniu wywołań funkcji, a także włączaniu się w procesy myślenia łańcuchowego (chain-of-thought, CoT).
Dlaczego otwartość ma znaczenie?
Udostępnienie modeli GPT-OSS na licencji Apache 2.0 niesie ze sobą szereg korzyści. Przede wszystkim oznacza to, że modele są całkowicie otwarte i nie ma żadnych ograniczeń dotyczących ich dostępu. Ta charakterystyka:
- Umożliwia deweloperom modyfikację i dostosowanie modeli do własnych potrzeb.
- Demokratyzuje dostęp do zaawansowanej technologii AI.
- Zachęca do przejrzystości i współpracy w branży poprzez usunięcie limitów dostępu (rate limits).
- Stwarza możliwości zastosowania modeli w różnych kontekstach, zarówno badawczych, jak i biznesowych.
Mimo że OpenAI podkreśla potencjalne ryzyko związane z otwartością modeli, zwracając uwagę na możliwość modyfikacji przez osoby o złych zamiarach, otwarta architektura tworzy nową rzeczywistość w świecie sztucznej inteligencji.
W kontekście wdrażania, modele GPT-OSS są gotowe do użycia z popularnymi platformami, takimi jak Northflank, która oferuje jednoklikowe wdrożenie gpt-oss-120b na infrastrukturze z dwoma GPU H100. Dzięki temu oraz dzięki wsparciu platformy Ollama, wdrożenie i korzystanie z tych modeli jest prostsze niż kiedykolwiek.
Zainteresowani tematyką AI i najnowszymi rozwiązaniami OpenAI? Nie zwlekaj, odwiedź nasz portal o ChatGPT: chatgpt4.pl i bądź na bieżąco z nowinkami!
Więcej o premierze GPT-OSS możecie przeczytać na Northflank Blog oraz OpenAI. Dodatkowe informacje znajdziesz też na blogu Simona Willison.