Gêmeos 1.5 Pro está aqui! Prepare-se para experimentar o próximo nível de reconhecimento de áudio

2024/04/10

Todos os grandes gigantes da tecnologia estão trabalhando em modelos de IA e, falando nisso, parece que o Google lançou uma nova versão do Gemini.

O Gemini 1.5 Pro foi lançado e oferece alguns recursos interessantes, então vamos mergulhar nele e ver o que há de novo.

Gemini 1.5 Pro está aqui, vem com um recurso de reconhecimento de áudio

O Google atualizou recentemente seu modelo de IA, e o Gemini 1.5 Pro está disponível em mais de 180 países por meio da visualização pública do Google AI Studio, como escreve MSPowerUser .

Gemini agora tem uma janela de contexto de 1 milhão que permite aos desenvolvedores analisar e compreender melhor as informações.

Isso não é tudo, esta versão também possui um recurso de reconhecimento de áudio, para que possa processar a linguagem falada. O upload de arquivos também é suportado, então você pode enviar um arquivo de áudio e o Gemini irá analisá-lo.

Aqui está o que os desenvolvedores têm a dizer sobre esse recurso:

A atualização também traz maior controle e funcionalidade para os desenvolvedores, e também há suporte para instruções do sistema para que você possa especificar facilmente funções, formatos e objetivos.

Por último, está disponível o modo JSON que permite a extração estruturada de dados de imagens e texto. cURL é atualmente suportado e o suporte Python SDK estará disponível em breve, de acordo com os desenvolvedores.

Isso não é tudo do Google, também há relatos de que o Gemini trará sugestões de replay para o Gmail para Android em breve, fique ligado.

Você pode fazer upload de uma gravação de uma palestra, como mais de 117.000 palestras simbólicas de Jeff Dean, e o Gemini 1.5 Pro pode transformá-la em um questionário com um gabarito.

Gemini 1.5 Pro está aqui, vem com um recurso de reconhecimento de áudio

Deixe um comentário Cancelar resposta