OpenAI ponownie zaskakuje nowościami w ChatGPT. Tym razem wprowadził zaawansowany tryb głosowy, umożliwiający swobodne i naturalne rozmowy w czasie rzeczywistym. Rozwiązanie to polega na użyciu jednej sieci neuronowej, wyposażonej w syntezator mowy na podstawie głosów profesjonalnych aktorów oraz system Whisper, który odpowiada za rozpoznawanie mowy. Jakie konkretnie korzyści daje nam ta innowacja?
Naturalność dialogów: nowy poziom interakcji
Zaawansowany tryb głosowy w ChatGPT zdecydowanie podnosi jakość interakcji z technologią. Możliwość przerywania sztucznej inteligencji, reagowania na emocje oraz prowadzenia dialogów przypominających rozmowy z drugim człowiekiem to nowa jakość, o której większość z nas dotychczas mogła tylko marzyć.
- Funkcja ta jest początkowo dostępna dla ograniczonej grupy subskrybentów ChatGPT Plus.
- Integracja głosowa jest bezpośrednio związana z głównym czatem, co likwiduje konieczność przełączania się między trybami.
- Użytkownicy mogą wybierać spośród pięciu profesjonalnie brzmiących głosów, co dodaje realizmu do dialogów.
Wprowadzone sposoby komunikacji są chwalone za swą naturalność oraz łatwość w prowadzeniu rozmowy, co można zobaczyć w licznych testach i recenzjach, np. na YouTube.
Dalsze usprawnienia i plany
Według zapowiedzi firmy OpenAI, tryb głosowy to dopiero początek. Przyszłe aktualizacje mają wzbogacić ChatGPT o:
- lepszą pamięć kontekstową,
- integrację z IoT,
- wsparcie dla wielozadaniowości,
- rozszerzenie funkcji multimedialnych.
Chociaż, jak można przeczytać w źródłach (np. bitcoin.pl, ITHardware), rollout dla wszystkich użytkowników Plus jest stopniowy i napotyka na opóźnienia. Na pełen tryb głosowy wielu z nas jeszcze czeka, ale funkcjonalności już wykorzystywane pokazują, że warto.
Na koniec, jeżeli jesteś entuzjastą AI i chcesz być na bieżąco ze wszystkimi nowinkami, zachęcamy do odwiedzenia naszego portalu: chatgpt4.pl. Tam znajdziesz najświeższe informacje i analizy na temat technologii ChatGPT i nie tylko.


