Jak korzystać z podpowiedzi głosowych i obrazkowych w ChatGPT
Co wiedzieć
- Od 27 września 2023 r. użytkownicy ChatGPT Plus i Enterprise mogą teraz wchodzić w interakcję z chatbotem za pomocą komunikatów obrazowych i głosowych, a także słyszeć jego odpowiedzi ludzkim głosem.
- Aby wprowadzić obrazy do podpowiedzi, dotknij ikony aparatu lub galerii po lewej stronie pola wiadomości i przechwyć lub wybierz obraz. Możesz także narysować obraz, aby określić, gdzie skupia się ChatGPT.
- Aby rozpocząć korzystanie z trybu głosowego, włącz tryb głosowy w Ustawieniach ChatGPT > Nowe funkcje.
- Rozpocznij rozmowę głosową, dotykając przycisku słuchawek w prawym górnym rogu i wybierając głos.
- ChatGPT pozwala wybierać spośród pięciu różnych ludzkich głosów.
Prawie rok od premiery OpenAI nadal dodaje funkcje, które ulepszają nie tylko możliwości ChatGPT, ale także sposób, w jaki z niego korzystasz. Najnowsza aktualizacja umożliwia teraz wydawanie poleceń głosowych i obrazów w formie monitów do ChatGPT oraz odczytywanie odpowiedzi na głos ludzkim głosem, co zasadniczo ułatwia konwersację między Tobą a chatbotem AI.
Oto wszystko, co musisz wiedzieć o tym, jak uzyskać dostęp do nowych trybów ChatGPT i z nich korzystać oraz o tym, jak przyczyniają się one do ściślejszej integracji sztucznej inteligencji w naszym życiu.
ChatGPT otrzymuje tryb głosowy i wizję
Aplikacja ChatGPT może już tłumaczyć nagrane komunikaty głosowe na tekst. Jednak obsługa bezpośrednich rozmów głosowych umożliwia teraz interakcję bez angażowania tekstu z którejkolwiek strony, dzięki czemu platforma jest znacznie bardziej elastyczna.
Funkcja głosowa działa zgodnie z oczekiwaniami – dotykasz ekranu i zaczynasz mówić. Słowa są następnie zamieniane na tekst i wysyłane do LLM. Odpowiedź zostaje ponownie zamieniona na mowę i na koniec odczytana wybranym przez Ciebie głosem.
OpenAI współpracowało z profesjonalnymi aktorami, aby zapewnić pięć różnych głosów, co dodaje autentyczny akcent do odpowiedzi, jednocześnie stymulując rozmowy w naturalny sposób.
Z drugiej strony jest Podpowiedź o obrazie, która, jak sama nazwa wskazuje, pozwala dodawać zdjęcia z aparatu lub galerii i zadawać pytania na ich temat. Działa w tym samym duchu, co Google Lens, aczkolwiek z bardziej niezawodnymi odpowiedziami dzięki zaawansowanej architekturze GPT.
Jak monitować ChatGPT za pomocą poleceń głosowych
Tryb głosowy otwiera nowy tryb rozmowy, ale nie jest on jeszcze dostępny dla wszystkich. OpenAI udostępnia je na razie wyłącznie użytkownikom ChatGPT Plus i Enterprise. Jest również dostępna tylko w aplikacji mobilnej ChatGPT na iOS i Androida, a nie w wersji komputerowej. Możesz włączyć tryb głosowy, wybierając Ustawienia > Nowe funkcje.
Aby rozpocząć korzystanie z trybu głosowego, dotknij ikony słuchawek w prawym górnym rogu ekranu głównego i wybierz głos z pięciu dostępnych opcji.
Po rozpoczęciu rozmowy zacznij mówić do mikrofonu.
Komunikat głosowy zostanie wysłany, gdy tylko przestaniesz mówić.
Możesz także dotknąć środka, aby wysłać monit ręcznie.
Użyj przycisków pauzy i zatrzymania, aby jeszcze bardziej kontrolować nagrania.
ChatGPT będzie teraz dostarczać odpowiedź wybranym przez Ciebie głosem. Aby przerwać odpowiedź, po prostu dotknij środka w trakcie wypowiadania.
Po udzieleniu odpowiedzi możesz ponownie zacząć mówić i poprowadzić rozmowę do przodu.
Zakończ czat, dotykając X na dole.
Jak zachęcić ChatGPT obrazami
Biorąc pod uwagę, że inne chatboty AI już to mają i działają, monity obrazowe stają się ważną funkcją, którą można wprowadzić na platformę obok trybu głosowego. To również jest dostępne wyłącznie dla użytkowników ChatGPT Plus i Enterprise. Ale na szczęście pojawia się również w wersji na komputery stacjonarne.
Aby rozpocząć, dotknij ikony aparatu w lewym dolnym rogu.
Przechwyć obraz.
I dotknij „Potwierdź”.
Obraz zostanie przesłany w polu wiadomości. Wpisz odpowiedni tekst i naciśnij Wyślij.
ChatGPT przeskanuje monity graficzne i tekstowe i odpowiednio zareaguje. Może nawet poprosić o więcej odniesień wizualnych.
Narysuj obraz, aby poprosić ChatGPT o skupienie się na obiekcie
Możesz także narysować obraz, aby skupić uwagę ChatGPT.
Oprócz aparatu możesz także dodawać obrazy z galerii lub folderów. Stuknij znak „+”, aby wyświetlić dodatkowe opcje monitu o obraz.
Następnie wybierz inny sposób przesyłania zdjęć.
Wybierz zdjęcie.
Do podpowiedzi można dodać wiele obrazów.
Kontynuuj rozmowy, korzystając z kolejnych obrazów i zapytań tekstowych. Lub przełącz się na głos i wypowiadaj pytania, które pasują do obrazów.
Dalekosiężne korzyści z możliwości głosu i obrazu ChatGPT
Implementacja naturalnych głosów ludzkich – lub ich dokładne odtworzenie – może zapewnić wiele rzeczywistych możliwości i scenariuszy.
Na przykład możesz zrobić zdjęcia swojego jedzenia i poprosić ChatGPT o oszacowanie spożycia kalorii, poproszenie go o przeczytanie Ci bajki na dobranoc jednym z preferowanych przez Ciebie głosów, otwartej nauki słuchowej lub zaplanowania za jej pomocą DAN. Choć nie pozwoli ci to nawiązać z nią relacji jak w filmach (przychodzi mi na myśl „Ona” Spike’a Jonesa), w istocie fabuła jest niesamowicie do niej zbliżona.
Posiadanie sztucznej inteligencji o ludzkim głosie nie tylko otwiera drzwi do nowatorskich zastosowań, ale także pozwala OpenAI współpracować z usługami takimi jak Spotify i innymi w celu opracowywania nowych funkcji opartych na sztucznej inteligencji dla ich własnych platform.
Często zadawane pytania
Rozważmy kilka często zadawanych pytań na temat nowych funkcji głosu i obrazu w ChatGPT.
Jak włączyć tryb głosowy i podpowiedzi obrazkowe w ChatGPT?
Aby rozpocząć korzystanie z trybów głosu i obrazu w ChatGPT, dotknij trzech poziomych linii i wybierz Ustawienia > Nowe funkcje. Upewnij się, że masz plan ChatGPT Plus lub Enterprise i korzystasz z GPT-4.
Dlaczego nie mogę znaleźć nowych funkcji w ustawieniach ChatGPT?
Jeśli nie widzisz opcji „Nowe funkcje”, Twoje urządzenie nie otrzymało jeszcze nowej aktualizacji. Sprawdź dostępność aktualizacji aplikacji w App Store lub Play Store. Chociaż funkcja jest już dostępna, OpenAI twierdzi, że zostanie udostępniona użytkownikom w ciągu najbliższych kilku tygodni.
Możliwość interakcji głosowej i przekazywania podpowiedzi obrazowych przywraca pionierów generatywnej sztucznej inteligencji z powrotem do walki z botami. Chociaż zarówno Bing AI, jak i Bard mają podobne funkcje, nie były w stanie wdrożyć multimodalności w żaden połączony, kompleksowy sposób. Bing AI nie jest w stanie odczytać na głos swojej odpowiedzi, a Bard nie otrzymał jeszcze samodzielnej aplikacji. Ponieważ giganci pozostają w tyle, ChatGPT będzie starał się nabrać dynamiki dla siebie i swoich użytkowników.
Mamy nadzieję, że ten przewodnik okazał się przydatny w zrozumieniu, w jaki sposób można korzystać z nowych metod głosowych i obrazowych w ChatGPT. Do następnego razu!
Dodaj komentarz