Gemini 1.5 Pro est là ! Préparez-vous à découvrir le prochain niveau de reconnaissance audio
Tous les grands géants de la technologie travaillent sur des modèles d’IA, et en parlant de cela, il semble que Google ait publié une nouvelle version de Gemini.
Le Gemini 1.5 Pro est sorti et offre des fonctionnalités intéressantes, alors plongons-y et voyons les nouveautés.
Gemini 1.5 Pro est là, livré avec une fonction de reconnaissance audio
Google a récemment mis à jour son modèle d’IA et Gemini 1.5 Pro est disponible dans plus de 180 pays via l’aperçu public de Google AI Studio, comme l’écrit MSPowerUser .
Gemini dispose désormais d’une fenêtre contextuelle d’un million qui permet aux développeurs de mieux analyser et comprendre les informations.
Ce n’est pas tout, cette version dispose également d’une fonction de reconnaissance audio, afin de pouvoir traiter la langue parlée. Le téléchargement de fichiers est également pris en charge, vous pouvez donc télécharger un fichier audio et Gemini l’analysera.
Voici ce que les développeurs avaient à dire à propos de cette fonctionnalité :
La mise à jour apporte également plus de contrôle et de fonctionnalités aux développeurs, et prend également en charge les instructions système afin que vous puissiez facilement spécifier des rôles, des formats et des objectifs.
Enfin, le mode JSON est disponible qui permet une extraction de données structurées à partir d’images et de texte. cURL est actuellement pris en charge et la prise en charge du SDK Python sera bientôt disponible, selon les développeurs.
Ce n’est pas tout de Google, il y a également des rapports selon lesquels Gemini apportera bientôt des suggestions de relecture à Gmail pour Android, alors restez à l’écoute.
Vous pouvez télécharger un enregistrement d’une conférence, comme une conférence de plus de 117 000 jetons de Jeff Dean, et Gemini 1.5 Pro peut le transformer en un quiz avec un corrigé.
Laisser un commentaire