雙子座1.5 Pro來了!準備好體驗更高水平的音訊識別
各大科技巨頭都在研究AI模型,說到這裡,Google似乎又發布了新版本的Gemini。
Gemini 1.5 Pro 已經發布,它提供了一些有趣的功能,所以讓我們深入研究一下,看看有什麼新功能。
Gemini 1.5 Pro來了,附音訊辨識功能
根據MSPowerUser 報導, Google最近更新了其 AI 模型,Gemini 1.5 Pro 可透過 Google AI Studio 的公開預覽版在 180 多個國家/地區使用。
Gemini 現在擁有 100 萬個上下文窗口,可以讓開發人員更好地分析和理解資訊。
這還不是全部,這個版本還具有音訊辨識功能,因此它可以處理口語。也支援文件上傳,因此您可以上傳音訊文件,Gemini 會對其進行分析。
以下是開發人員對此功能的評價:
此更新還為開發人員帶來了更好的控制和功能,並且還支援系統指令,以便您可以輕鬆指定角色、格式和目標。
最後,還提供 JSON 模式,允許從圖像和文字中提取結構化資料。據開發人員稱,目前支援 cURL,並且即將推出 Python SDK 支援。
這還不是 Google 的全部,還有報導說 Gemini 很快就會為 Android 版 Gmail 帶來重播建議,敬請期待。
您可以上傳講座錄音,例如 Jeff Dean 的 117,000+ 代幣講座,Gemini 1.5 Pro 可以將其變成帶有答案的測驗。
發佈留言