Transmisja strumieniowa wideo na żywo do ChatGPT z zaawansowanym trybem głosowym: przewodnik krok po kroku

2024/12/13

Podstawowe informacje

Ulepszony zaawansowany tryb głosowy ChatGPT może teraz postrzegać i interpretować otoczenie wokół Ciebie.
Aby aktywować funkcję wideo w trybie zaawansowanego głosu, wybierz ikonę wideo znajdującą się w lewym dolnym rogu.
Ta funkcjonalność jest obecnie dostępna dla abonentów Plus i Pro za pośrednictwem aplikacji mobilnych ChatGPT. Nie ma informacji, kiedy zostanie udostępniona użytkownikom darmowym.

Zaawansowany tryb głosowy ChatGPT został ulepszony, aby uwzględnić „wizualną” funkcję, która pozwala rozpoznawać i rozumieć, co znajduje się w pobliżu, za pomocą kamery urządzenia. Ta innowacyjna funkcja umożliwia ChatGPT otrzymywanie w czasie rzeczywistym strumienia wideo z Twojej perspektywy w celu natychmiastowej analizy.

Ta multimodalna funkcjonalność została pierwotnie zaprezentowana prawie siedem miesięcy temu podczas premiery Advanced Voice Mode firmy OpenAI. Poniżej przedstawiono kroki przesyłania strumieniowego wideo na żywo do ChatGPT AVM, umożliwiające komunikację głosową i wideo w czasie rzeczywistym.

Jak korzystać z komunikacji wideo w czasie rzeczywistym dzięki zaawansowanemu trybowi głosowemu ChatGPT

Dzięki najnowszym funkcjom wideo w trybie Advanced Voice Mode nie musisz już robić zdjęć ani zrzutów ekranu; zamiast tego możesz bezpośrednio włączyć kamerę w aplikacji i wysłać do ChatGPT zapytanie o to, co zostało uchwycone w kadrze.

Krok 1: Otwórz zaawansowany tryb głosowy w aplikacji ChatGPT na swoim urządzeniu mobilnym.

Krok 2: Po zainicjowaniu trybu Advanced Voice Mode zauważysz charakterystyczną ikonę wideo w lewym dolnym rogu. Kliknij ją, aby rozpocząć transmisję strumieniową wideo na żywo.

Krok 3: Zezwól aplikacji na dostęp do aparatu w smartfonie.

Krok 4: Umieść obiekt, który chcesz pokazać, w kadrze aparatu i po prostu zapytaj o to ChatGPT.

Krok 5: ChatGPT odpowie na Twoje zapytania na podstawie bezpośrednio otrzymanych informacji wizualnych. Możesz prowadzić dialog bez użycia rąk.

Krok 6: Jeśli znajdujesz się w słabo oświetlonym miejscu, dotknij ikony lampy błyskowej w lewym dolnym rogu ramki, aby rozjaśnić obiekt. Użyj ikony aparatu odwróconego w prawym dolnym rogu ramki, aby przełączać się między przednim i tylnym aparatem.

Krok 8: Aby zakończyć udostępnianie wideo, po prostu naciśnij ponownie ikonę wideo, a powrócisz do rozmowy wyłącznie głosowej.

Krok 9: Podobnie jak poprzednio, po zakończeniu trybu głosowego otrzymasz transkrypcję dialogu.

OpenAI przedstawiło wizualną pojemność Advanced Voice Mode 6. dnia swojego wydarzenia 12 Days of OpenAI, które odniosło ogromny sukces dzięki licznym aktualizacjom i nowym narzędziom, takim jak Sora, generator tekstu na wideo. Bądźcie czujni na dalsze postępy w technologii AI.

Podstawowe informacje

Jak korzystać z komunikacji wideo w czasie rzeczywistym dzięki zaawansowanemu trybowi głosowemu ChatGPT

Dodaj komentarz Anuluj pisanie odpowiedzi