Le modèle GPT-4o d’OpenAI est tout ce que nous voulions que les assistants vocaux soient
Ce qu’il faut savoir
- La mise à jour de printemps d’OpenAI a introduit GPT-4o, le nouveau modèle phare de la société.
- OpenAI a également présenté un mode vocal amélioré qui est l’assistant le plus émotif et le plus réaliste à ce jour.
- GPT-4o et son API seront disponibles pour tous les utilisateurs, tandis que le mode vocal n’est pour l’instant déployé que pour les abonnés Plus.
- ChatGPT publiera également bientôt son application de bureau pour Mac ; une application Windows sera disponible cette année.
OpenAI a encore une fois placé la barre plus haut. Bien que les nouvelles de l’événement Spring Update n’impliquent aucune incursion dans le territoire des moteurs de recherche, OpenAI a conquis le cœur et l’esprit de nombreuses personnes avec son nouveau modèle GPT-4o. Il est rapide, vif et, avec un mode vocal amélioré, il ressemble effrayant à l’assistant IA du film Her de Spike Jonze en 2013.
Mais surtout, c’est une grande avancée en matière d’assistants vocaux sur smartphone dont ChatGPT veut revendiquer et pour lesquels il est désormais également parfaitement adapté. Voici tout ce que vous devez savoir sur GPT, les mises à niveau du mode vocal sur ChatGPT et ce qu’elles impliquent pour l’industrie.
Le modèle GPT-4o rend ChatGPT plus vif et plus émotif que n’importe quel chatbot ou assistant IA
https://www.youtube.com/watch?v=vgYi3Wr7v_g
GPT-4o (« o » pour omni) est le nouveau modèle phare de la société et également le premier modèle combinant texte, vision et audio. Il possède une intelligence de niveau GPT-4, mais il est plus rapide et plus efficace. Sur la version précédente du mode vocal, qui fonctionnait avec un mélange de trois modèles avec différents degrés d’intelligence, une grande partie de l’intelligence principale de niveau GPT-4 était perdue. C’est là que GPT-4o est différent.
GPT-4o est le premier modèle, formé de bout en bout sur les trois modalités texte, vision et audio, pour alimenter uniquement le mode vocal. Et cela montre. Dans l’une des démos, les gens d’OpenAI ont installé ChatGPT sur deux téléphones pour se parler et chanter des chansons.
https://www.youtube.com/watch?v=MirzFk_DSiI
Les réponses de ChatGPT sont suffisamment rapides pour arriver en temps réel. Il peut également faire des choses comme observer le ton, détecter l’état émotionnel à partir de la voix et des vidéos, donner des conseils, vous aider à coder, traduire en direct, tout en donnant l’impression que tout cela ressemble à une conversation humaine intime.
Pendant l’événement, ChatGPT a dramatisé des histoires avant d’aller au lit, a changé de voix en un rien de temps et s’est terminé par une chanson.
https://www.youtube.com/watch?v=D9byh4MAsUQ
Ce ne sont là que quelques-unes des nombreuses choses que ChatGPT peut faire avec l’omni-modèle GPT-4, qui innove déjà. Étant les premiers du genre, les futurs modèles omni pourraient changer complètement la façon dont nous discutons avec ChatGPT et notre relation avec lui.
GPT-4o est gratuit pour tous !
GPT-4o n’est pas non plus réservé aux membres Plus uniquement. Le fait qu’OpenAI mettra automatiquement à niveau les utilisateurs gratuits avec GPT-4o place la barre plus haut pour les autres chatbots à tous les niveaux. Cela s’avère particulièrement pratique pour les utilisateurs qui souhaitent remplacer Google Assistant (ou Gemini de nos jours) pour lequel ChatGPT est parfaitement adapté.
Il existe déjà des moyens permettant aux utilisateurs d’Android d’utiliser ChatGPT comme assistant numérique. Certains fabricants, comme Nothing, vous permettent également d’ajouter ChatGPT à la vignette de configuration rapide pour un accès plus rapide au mode vocal. Mais un assistant ChatGPT officiel pourrait bien être le remplacement souhaité par les utilisateurs.
Avec la sortie d’une application de bureau officielle ChatGPT, ChatGPT pourrait bien être votre seul assistant sur tous les appareils. L’application Windows ChatGPT arrivera plus tard cette année, tandis qu’une application pour Mac sera bientôt déployée dans les semaines à venir.
GPT-4o est un modèle plus petit et plus efficace
Le GPT-4o est le modèle le plus rapide et le plus abordable à ce jour, détrônant le GPT-4 Turbo sur plusieurs fronts. Avec une intelligence de niveau GPT-Turbo, GPT-4o devrait être deux fois plus rapide, bien que les tests réels n’aient pas encore confirmé cela. Mais il existe également diverses autres améliorations. Comparez les principales caractéristiques ci-dessous :
OpenAI rend également GPT-4o disponible dans les API de chat, d’assistants et de lots, sur lesquelles les développeurs se lanceront volontiers dès sa sortie, d’autant plus que les jetons d’API sont à la moitié du prix de GPT-4 Turbo.
La vitesse du nouveau modèle de ChatGPT est particulièrement utile dans les traductions en direct, comme le démontre OpenAI, sa fonction vocale fonctionnant comme un médiateur tiers entre des personnes parlant des langues différentes.
https://www.youtube.com/watch?v=c2DFg53Zhvw
Le nouveau mode voix et vidéo ressemble à l’IA des films
Grâce au modèle omni, ChatGPT a un quotient émotionnel beaucoup plus large, dans le sens où il peut détecter des états émotionnels simplement en écoutant votre voix ou en regardant vos expressions faciales. Mais en plus d’avoir des yeux et des oreilles, c’est la voix qui ajoute cet élément humain magique et donne l’illusion d’un fantôme dans la machine qui semble avoir captivé l’imagination des gens du monde entier.
Sam Altman l’a appelé à juste titre « l’IA du cinéma ». Si l’on en croit le ton léger et légèrement coquette de la démo, il ne sera pas surprenant de voir les gens adopter plus volontiers ChatGPT comme assistant plutôt que les assistants par défaut traditionnels qui, franchement, semblent désormais désuets. Mais avant de vous lier d’amitié avec ChatGPT ou de devenir intime avec votre compagnon numérique, tenez peut-être compte du message du film auquel Altman fait allusion et évitez les pièges de confondre la compagnie numérique avec la vraie.
Apple s’associera-t-il à OpenAI pour remplacer Siri ?
Quelques jours seulement avant l’événement, Apple aurait été sur le point de conclure un accord avec OpenAI pour intégrer de nouvelles fonctionnalités d’IA sur les futurs iPhones. Maintenant que GPT-4o est disponible avec un mode vocal meilleur et plus évocateur, nous pourrions voir les capacités de ChatGPT être portées sur un certain nombre de fonctionnalités iOS, y compris Siri. Il serait peut-être exagéré d’imaginer qu’Apple abandonne Siri de sitôt, voire jamais. Mais il pourrait bien être amélioré avec des capacités pas trop différentes de celles proposées par ChatGPT. D’autres nouvelles à ce sujet devraient être annoncées à l’approche de la WWDC en juin. Alors restez à l’écoute pour cela.
Quand GPT-4o sera-t-il déployé ?
Annoncé récemment, GPT-4o pourrait prendre un certain temps avant d’être déployé auprès des utilisateurs du monde entier. Quant au mode vocal spritely, les abonnés Plus seront les premiers à y accéder. Donc, si vous souhaitez découvrir la nouvelle fonctionnalité, discuter plus longtemps et obtenir des réponses rapides de l’assistant AI, un abonnement Plus en vaut toujours la peine.
Avec une architecture meilleure et plus rapide et une gamme plus large de capacités émotionnelles, ChatGPT est parfaitement positionné pour devenir votre assistant vocal préféré, peut-être même un ami.
Qu’en pensez-vous ? Êtes-vous impatient d’essayer ChatGPT comme assistant numérique ? Les possibilités de conversations créatives sont infinies, tout comme les risques d’abus. Ainsi, même si vous testez les nouvelles fonctionnalités, n’oubliez pas de les utiliser avant tout comme un outil. Jusqu’à la prochaine fois! Soyez prudent.
Laisser un commentaire