雙子座1.5 Pro來了!準備好體驗更高水平的音訊識別

雙子座1.5 Pro來了!準備好體驗更高水平的音訊識別

各大科技巨頭都在研究AI模型,說到這裡,Google似乎又發布了新版本的Gemini。

Gemini 1.5 Pro 已經發布,它提供了一些有趣的功能,所以讓我們深入研究一下,看看有什麼新功能。

Gemini 1.5 Pro來了,附音訊辨識功能

根據MSPowerUser 報導, Google最近更新了其 AI 模型,Gemini 1.5 Pro 可透過 Google AI Studio 的公開預覽版在 180 多個國家/地區使用。

Gemini 現在擁有 100 萬個上下文窗口,可以讓開發人員更好地分析和理解資訊。

這還不是全部,這個版本還具有音訊辨識功能,因此它可以處理口語。也支援文件上傳,因此您可以上傳音訊文件,Gemini 會對其進行分析。

以下是開發人員對此功能的評價:

此更新還為開發人員帶來了更好的控制和功能,並且還支援系統指令,以便您可以輕鬆指定角色、格式和目標。

最後,還提供 JSON 模式,允許從圖像和文字中提取結構化資料。據開發人員稱,目前支援 cURL,並且即將推出 Python SDK 支援。

這還不是 Google 的全部,還有報導說 Gemini 很快就會為 Android 版 Gmail 帶來重播建議,敬請期待。

您可以上傳講座錄音,例如 Jeff Dean 的 117,000+ 代幣講座,Gemini 1.5 Pro 可以將其變成帶有答案的測驗。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *