Czym są wtyczki ChatGPT i jak działają
ChatGPT zmiótł świat z nóg w ciągu ostatnich kilku miesięcy, odkąd został udostępniony publicznie. W rzeczywistości minęło tylko kilka miesięcy? Wpływ, jaki wywarł, sprawia, że wydaje się, że istnieje od lat.
Ale przy wszystkich swoich zaletach miał jedną drobną wadę, która wcale nie była taka mała; nie miał dostępu do najnowszych informacji. Jedyne informacje, jakie posiadał, pochodziły z okresu do połowy 2021 roku. Ale OpenAI w końcu zaczyna to zmieniać. Nie, nie został przeszkolony na nowszych danych. Jednak OpenAI w końcu wdraża wczesną obsługę wtyczek w ChatGPT, które pozwalają mu łączyć się z Internetem, a także niektórymi usługami stron trzecich!
Czym są wtyczki ChatGPT?
Wtyczki to narzędzia zaprojektowane specjalnie dla modeli językowych. Zwiększają możliwości chatbota i pozwalają mu podejmować zadania, które wcześniej były niemożliwe. Na przykład może teraz pobierać informacje w czasie rzeczywistym, takie jak wyniki sportowe, ceny akcji, wykonywać działania w imieniu użytkownika, takie jak rezerwowanie lotów, oraz pobierać informacje z bazy wiedzy, takie jak dokumenty firmowe itp.
Od czasu premiery ChatGPT wtyczki były najbardziej pożądanym elementem ze strony użytkowników, a OpenAI w końcu je dostarczyło. Ale ich wydanie będzie stopniowe, iteracyjne. Początkowo OpenAI wydało tylko kilka wtyczek innych firm i kilka własnych wtyczek.
Dostęp dla użytkowników, a także programistów, którzy chcą budować wtyczki, jest obecnie również ograniczony. Co więcej, jako użytkownik końcowy dostęp jest obecnie przyznawany tylko użytkownikom ChatGPT Plus, ale ChatGPT mówi, że planują rozszerzyć wdrożenie w przyszłości.
O dostęp można poprosić dopiero po dołączeniu do listy oczekujących , co wiąże się z wypełnieniem krótkiego kwestionariusza wyjaśniającego, dlaczego chcesz uzyskać dostęp i czy byłbyś skłonny przekazać opinię.
Lista wtyczek innych firm obejmuje:
- Expedia – Ta wtyczka pozwoli Ci zaplanować następną podróż z ChatGPT, z pełnymi informacjami o dostępności i cenach hoteli, lotów itp.
- FiscalNote – Ta wtyczka ChatGPT umożliwi dostęp do informacji i danych prawnych, politycznych i regulacyjnych w czasie rzeczywistym.
- Instacart – Użyj ChatGPT, aby zamówić artykuły spożywcze z pobliskich sklepów spożywczych i supermarketów.
- KAYAK – Użyj KAYAK w ChatGPT, aby znaleźć samochody, hotele, wypożyczalnie itp. w ramach określonego budżetu.
- Zakupy Klarna – Wyszukuj i porównuj ceny z różnych sklepów internetowych w ramach rozmowy ChatGPT.
- Milo Family AI – Wtyczka dla rodziców, aby doładować rodzicielstwo.
- OpenTable – Uzyskaj rekomendacje restauracji i linki do rezerwacji na czatach.
- Kupuj w Shopify — wyszukuj produkty różnych marek.
- Slack – Użyj ChatGPT ze Slackiem, aby usprawnić komunikację
- Mów — skorzystaj z pomocy nauczyciela języka opartego na sztucznej inteligencji
- Wolfram – Pobierz ChatGPT, aby uzyskać dostęp do obliczeń, wiedzy matematycznej itp.
- Zapier – Użyj tej wtyczki do interakcji z ponad 5000 aplikacji w ChatGPT.
Istnieją również dwie wtyczki samego OpenAI: Browsing (przeglądarka internetowa) i interpreter kodu oraz wtyczka open source o nazwie Retriever. Wszystkie wtyczki są obecnie w fazie testów alfa.
Jak działają te wtyczki?
Według OpenAI wtyczki są „oczami i uszami” dla modeli językowych, takich jak ChatGPT. Faktem dotyczącym modeli językowych jest to, że mogą uczyć się tylko na podstawie swoich danych treningowych i że uczenie się może być ograniczone. ChatGPT może samodzielnie udostępniać jedynie instrukcje tekstowe. Wtyczki te mogą sprawić, że będzie postępował zgodnie z tymi instrukcjami, a także udostępnić informacje, które są zbyt aktualne, zbyt osobiste lub zbyt szczegółowe i nie mogą być uwzględnione w danych szkoleniowych.
Istnieje jednak obawa dotycząca bezpieczeństwa, która pojawia się, gdy myślisz o modelu AI, który postępuje zgodnie z instrukcjami i wykonuje działania w Twoim imieniu. To jest powód, dla którego wtyczki są wdrażane powoli. OpenAI buduje je z zachowaniem bezpieczeństwa jako podstawową zasadą i będzie monitorować ich rzeczywiste wykorzystanie.
Przyjrzyjmy się, jak działają niektóre z tych modeli wtyczek.
Przeglądanie
Jest to wtyczka, która łączy ChatGPT z Internetem i jest jedną z dwóch wtyczek samego OpenAI. Wtyczka korzysta z interfejsu API wyszukiwania Bing firmy Microsoft w niezbyt ciekawym zwrocie wydarzeń; obie firmy miały umowy sięgające lat wstecz. Oprócz początkowych inwestycji, Microsoft wykorzystuje teraz również technologię OpenAI do zasilania swojej nowej sztucznej inteligencji Bing.
Modelka nie tylko wie, jak przeglądać internet, ale także wie, kiedy go przeglądać, a kiedy nie. Na przykład, gdy użytkownik prosi ChatGPT o informacje na temat Oscarów 2023, dokładnie przeszukuje internet pod kątem zapytania. Ale zapytany o pierwsze w historii rozdanie Oscarów, nie przeszukuje internetu, ponieważ te informacje są częścią jego danych treningowych.
Tak więc, aby ChatGPT przeglądał Internet, musisz wybrać model/wtyczkę „Przeglądanie”.
Teraz, gdy użytkownik wprowadzi monit wymagający przeglądania Internetu, zrobi to; proces zajmie trochę czasu, ponieważ bot będzie potrzebował czasu na zapoznanie się z informacjami. Możesz zobaczyć przepływ akcji ChatGPT, dopóki nie wygeneruje odpowiedzi poprzez rozwinięcie kafelka „Przeglądanie sieci…”.
Tam możesz zobaczyć, jakich zapytań szukał, jakie linki kliknął i kiedy czytał w czasie rzeczywistym. Wykorzystuje tekstową przeglądarkę internetową, dzięki czemu może wyjść poza wyniki wyszukiwania i faktycznie czytać strony internetowe i nawigować po nich.
Gdy ChatGPT dogoni wydarzenia, udzieli odpowiedzi w swoim modelu języka naturalnego, tak jak poprzednio. Ale odpowiedź będzie zawierała cytaty, gdy zostanie wygenerowana za pomocą modelu przeglądania. Kliknięcie w cytat przeniesie Cię na stronę. Ten konkretny aspekt jest taki sam jak Bing Chat AI.
Z punktu widzenia bezpieczeństwa przeglądarka tekstowa może wysyłać tylko żądania GET, co zmniejsza pewne ryzyko. Na przykład model może tylko pobierać informacje z Internetu, ale nie może wykonywać operacji „transakcyjnych”, takich jak przesyłanie formularza.
Tłumacz kodu
Model Code Interpreter, druga wtyczka OpenAI, zapewnia ChatGPT z interpreterem Pythona. Zapewnia mu również krótkotrwałe miejsce na dysku.
Sesja jest żywa podczas pojedynczego czatu, więc następna rozmowa może opierać się na poprzedniej rozmowie, ale istnieje górny limit czasu. Dodatkowo Code Interpreter obsługuje również przesyłanie plików i pobieranie plików z wynikami.
Aby zapewnić bezpieczeństwo, OpenAI przechowuje go w piaskownicy i chronionym zaporą ogniową środowisku wykonawczym. Dostęp do Internetu jest również wyłączony dla Code Interpreter. Według OpenAI, mimo że to posunięcie ogranicza funkcjonalność modelu, początkowo uważają, że jest to właściwe posunięcie.
Model „Interpretator kodu” należy wybrać przed rozpoczęciem rozmowy.
Gdy użytkownik wprowadzi monity, które wymagają użycia wtyczki Code Interpreter, ChatGPT zacznie go używać do wykonywania wymaganych obliczeń. Podobnie jak w przypadku przeglądania, użytkownik może zobaczyć przepływ obliczeń ChatGPT, klikając „Pokaż pracę”, a wszystkie etapy obliczeń będą widoczne.
We wstępnych testach OpenAI odkryło, że ta wtyczka jest przydatna w niektórych scenariuszach. Obejmują one:
- Rozwiązywanie problemów matematycznych, zarówno ilościowych, jak i jakościowych, które, szczerze mówiąc, użytkownicy uznali wcześniej za bzdury.
- Wykonywanie analiz i wizualizacji danych, co cieszy wielu użytkowników.
- Konwersja plików między formatami
OpenAI oczekuje, że użytkownicy odkryją bardziej przydatne zadania, które interpreter kodu może wykonać, gdy go wypróbują.
Wtyczki stron trzecich
Reszta wtyczek podlega modelowi wtyczek. Obejmuje to również wtyczkę open-source Retriever firmy OpenAI, z której będą mogli korzystać programiści, oraz 12 wtyczek innych firm.
Po wybraniu modelu wtyczek z rozwijanego menu, użytkownik może zainstalować żądane wtyczki ze sklepu.
Oto jak wtyczki będą działać w pigułce:
Gdy użytkownicy aktywują wtyczkę, instalując ją (nie zostanie ona aktywowana automatycznie) i rozpoczną rozmowę, OpenAI wprowadzi zwięzły opis wtyczki do ChatGPT w wiadomości. Ta wiadomość nie jest widoczna dla użytkowników końcowych, ale będzie zawierać opis wtyczki, punkty końcowe i przykłady. Tak więc, dopóki nie zdecydujesz się użyć wtyczki w rozmowie, ChatGPT nie będzie o niej wiedział. Musisz aktywować wtyczki, których chcesz używać w każdej rozmowie.
Teraz możesz umieścić swoje zapytanie w ChatGPT. Jeśli bot uzna za stosowne wywołanie wtyczki, zrobi to za pomocą wywołania API. Innymi słowy, może sam zdecydować, czy należy wywołać wtyczkę.
Następnie uwzględni wyniki uzyskane z wtyczki w odpowiedzi, którą generuje dla Ciebie.
Oto przykład, w jaki sposób ChatGPT używa wtyczek z OpenTable, Wolfram i Instacart. Użytkownik prosi ChatGPT o polecenie wegańskiej restauracji na sobotę i wegańskiego przepisu na niedzielę. Proszą go również o obliczenie kalorii dla przepisu, który zaleca przy użyciu Wolframa, a także o zamówienie składników przepisu z Instacart. Bot AI robi dokładnie to.
Po pierwsze, korzysta z OpenTable, aby polecić restaurację i link do rezerwacji.
Zaleca przepis wegański (który mógł zrobić wcześniej), a następnie oblicza kalorie dla przepisu za pomocą Wolframa.
Na koniec dodaje wszystkie wymagane składniki do koszyka na Instacart i przedstawia użytkownikowi link, który użytkownik może po prostu kliknąć, aby sfinalizować zamówienie!
Wtyczki całkowicie zmienią sposób działania ChatGPT. Szybkość, z jaką sztuczna inteligencja rozwija się w ciągu ostatnich kilku miesięcy, sprawia, że życie jest równie przerażające i wspaniałe, prawda?
Dodaj komentarz