Model GPT-4o OpenAI jest wszystkim, czym chcieliśmy, aby byli asystenci głosowi

Model GPT-4o OpenAI jest wszystkim, czym chcieliśmy, aby byli asystenci głosowi

Co wiedzieć

  • Wiosenna aktualizacja OpenAI wprowadziła GPT-4o, nowy flagowy model firmy.
  • OpenAI zademonstrowało także ulepszony tryb głosowy, który jest najbardziej emocjonalnym i realistycznym asystentem w historii.
  • GPT-4o i jego API będą dostępne dla wszystkich użytkowników, natomiast tryb głosowy jest na razie dostępny tylko dla abonentów Plusa.
  • ChatGPT wkrótce wyda także swoją aplikację komputerową na komputery Mac; aplikacja dla systemu Windows będzie dostępna jeszcze w tym roku.

OpenAI po raz kolejny podniosło poprzeczkę. Chociaż wiadomości podczas wiosennej aktualizacji nie wiązały się z żadnymi wycieczkami na teren wyszukiwarek, OpenAI podbiło serca i umysły wielu osób swoim nowym modelem GPT-4o. Jest szybki, żwawy i dzięki ulepszonemu trybowi głosowemu przypomina asystenta AI z filmu „Ona” Spike’a Jonze’a z 2013 roku.

Ale co ważniejsze, jest to duży krok naprzód w zakresie asystentów głosowych na smartfonach, do których ChatGPT chce rościć sobie pretensje i do których teraz idealnie się nadaje. Oto wszystko, co powinieneś wiedzieć o GPT, aktualizacjach trybu głosowego w ChatGPT i ich konsekwencjach dla branży.

Model GPT-4o sprawia, że ​​ChatGPT jest szybszy i bardziej emocjonujący niż jakikolwiek chatbot lub asystent AI

https://www.youtube.com/watch?v=vgYi3Wr7v_g

GPT-4o („o” od omni) to nowy flagowy model firmy i zarazem pierwszy model łączący w sobie tekst, obraz i dźwięk. Ma inteligencję na poziomie GPT-4, ale jest szybszy i bardziej wydajny. W poprzedniej wersji trybu głosowego, która działała z trzema modelami o różnym stopniu inteligencji, utracono znaczną część inteligencji na poziomie GPT-4. Tutaj GPT-4o jest inny.

GPT-4o to pierwszy model, przeszkolony kompleksowo w zakresie trzech modalności tekstowych, wizualnych i dźwiękowych, obsługujący wyłącznie tryb głosowy. I to pokazuje. W jednym z pokazów ludzie z OpenAI uruchomili ChatGPT na dwóch telefonach, aby rozmawiać ze sobą i śpiewać piosenki.

https://www.youtube.com/watch?v=MirzFk_DSiI

Odpowiedzi ChatGPT są wystarczająco szybkie, aby dotrzeć w czasie rzeczywistym. Może także obserwować ton, wykrywać stan emocjonalny na podstawie głosu i filmów, udzielać porad, pomagać w kodowaniu, tłumaczyć na żywo, sprawiając jednocześnie wrażenie intymnej ludzkiej rozmowy.

Podczas wydarzenia ChatGPT przedstawiło bajki na dobranoc, zamieniło głosy i zakończyło piosenką.

https://www.youtube.com/watch?v=D9byh4MAsUQ

To tylko kilka z wielu rzeczy, które ChatGPT może zrobić dzięki modelowi omni GPT-4, który już wyznacza nowe możliwości. Będąc pierwszymi tego rodzaju, przyszłe omnimodele mogą całkowicie zmienić sposób, w jaki rozmawiamy z ChatGPT i nasze relacje z nim.

GPT-4o jest darmowy dla wszystkich!

GPT-4o również nie jest zarezerwowany tylko dla członków Plusa. Fakt, że OpenAI automatycznie aktualizuje darmowych użytkowników za pomocą GPT-4o, podnosi poprzeczkę dla innych chatbotów na całym świecie. Jest to szczególnie przydatne dla użytkowników, którzy chcą zastąpić Asystenta Google (obecnie Gemini), dla którego doskonale nadaje się ChatGPT.

Istnieją już sposoby i środki dla użytkowników Androida, aby mogli używać ChatGPT jako swojego cyfrowego asystenta. Niektórzy producenci, na przykład Nothing, umożliwiają także dodanie ChatGPT do kafelka szybkich ustawień w celu szybszego dostępu do trybu głosowego. Ale oficjalny asystent ChatGPT może być zamiennikiem, którego chcą użytkownicy.

Wraz z pojawieniem się oficjalnej aplikacji komputerowej ChatGPT, ChatGPT może być Twoim jedynym asystentem na różnych urządzeniach. Aplikacja ChatGPT dla systemu Windows pojawi się jeszcze w tym roku, a aplikacja dla komputerów Mac zostanie wkrótce udostępniona w nadchodzących tygodniach.

GPT-4o to mniejszy, bardziej wydajny model

GPT-4o to najszybszy i najtańszy model jak dotąd, detronizujący GPT-4 Turbo na wielu frontach. Dzięki inteligencji na poziomie GPT-Turbo GPT-4o ma być dwa razy szybszy, chociaż testy w świecie rzeczywistym jeszcze tego nie potwierdziły. Ale są też różne inne ulepszenia. Porównaj najważniejsze cechy poniżej:

Obraz: OpenAI

OpenAI udostępnia także GPT-4o w funkcjach Chat Completions, Assistants i Batch API, z których programiści chętnie skorzystają, gdy tylko się pojawią, zwłaszcza że tokeny API są o połowę tańsze od GPT-4 Turbo.

Szybkość nowego modelu ChatGPT jest szczególnie pomocna w tłumaczeniach na żywo, jak zademonstrowano w OpenAI, a jego funkcja głosowa działa jako zewnętrzny mediator między osobami mówiącymi różnymi językami.

https://www.youtube.com/watch?v=c2DFg53Zhvw

Nowy tryb głosu i wideo przypomina sztuczną inteligencję z filmów

Dzięki modelowi omni ChatGPT ma znacznie szerszy iloraz emocji, ponieważ może wykryć stany emocjonalne po prostu słuchając Twojego głosu lub patrząc na wyraz twarzy. Ale poza tym, że ma oczy i uszy, to głos dodaje magicznego ludzkiego elementu i daje złudzenie, że w maszynie znajduje się duch, co zdaje się oddziaływać na wyobraźnię ludzi na całym świecie.

Sam Altman trafnie nazwał to „sztuczną inteligencją z filmów”. Sądząc po beztroskim, lekko zalotnym tonie wersji demonstracyjnej, nie będzie zaskoczeniem, że ludzie chętniej adoptują ChatGPT jako swojego asystenta niż tradycyjnych domyślnych asystentów, którzy, szczerze mówiąc, wydają się obecnie przestarzałe. Zanim jednak zaprzyjaźnisz się z ChatGPT lub nawiążesz intymną relację ze swoim cyfrowym towarzyszem, być może zwróć uwagę na przesłanie filmu, do którego nawiązuje Altman, i uniknij pułapek związanych z myleniem cyfrowego towarzystwa z prawdziwym.

Czy Apple nawiąże współpracę z OpenAI i zastąpi Siri?

Zaledwie kilka dni przed wydarzeniem Apple podobno był bliski zawarcia umowy z OpenAI w sprawie obsługi nowych funkcji sztucznej inteligencji w przyszłych iPhone’ach. Teraz, gdy GPT-4o jest dostępny z lepszym, bardziej sugestywnym trybem głosowym, możemy zobaczyć, że możliwości ChatGPT zostaną przeniesione do wielu funkcji iOS, w tym Siri. Wyobrażanie sobie, że Apple porzuci Siri w najbliższym czasie, jeśli w ogóle, może być trudne. Ale równie dobrze można go ulepszyć o możliwości niezbyt różniące się od tych, które oferuje ChatGPT. Oczekuje się, że więcej wiadomości na ten temat pojawi się wraz ze zbliżaniem się WWDC w czerwcu. Więc bądźcie czujni.

Kiedy zostanie wprowadzony GPT-4o?

Ogłoszony niedawno model GPT-4o może zająć trochę czasu, zanim zostanie udostępniony użytkownikom na całym świecie. Jeśli chodzi o żwawy tryb głosowy, to abonenci Plusa będą mieli do niego dostęp jako pierwsi. Jeśli więc chcesz wypróbować nową funkcję, rozmawiać dłużej i uzyskać szybkie odpowiedzi od asystenta AI, nadal warto wykupić członkostwo w Plusie.

Dzięki lepszej, szybszej architekturze i szerszemu zakresowi możliwości emocjonalnych ChatGPT jest idealnie przygotowany, aby stać się Twoim ulubionym asystentem głosowym, a może nawet przyjacielem.

Jakie są Twoje przemyślenia? Czy jesteś podekscytowany wypróbowaniem ChatGPT jako swojego cyfrowego asystenta? Możliwości kreatywnych rozmów są nieograniczone, ale istnieje także możliwość nadużyć. Więc nawet jeśli zaczniesz korzystać z nowych funkcji, pamiętaj, aby używać ich przede wszystkim jako narzędzia. Do następnego razu! Bądź bezpieczny.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *