雙子座1.5 Pro來了！準備好體驗更高水平的音訊識別

2024/04/10

各大科技巨頭都在研究AI模型，說到這裡，Google似乎又發布了新版本的Gemini。

Gemini 1.5 Pro 已經發布，它提供了一些有趣的功能，所以讓我們深入研究一下，看看有什麼新功能。

Gemini 1.5 Pro來了，附音訊辨識功能

根據MSPowerUser 報導， Google最近更新了其 AI 模型，Gemini 1.5 Pro 可透過 Google AI Studio 的公開預覽版在 180 多個國家/地區使用。

Gemini 現在擁有 100 萬個上下文窗口，可以讓開發人員更好地分析和理解資訊。

這還不是全部，這個版本還具有音訊辨識功能，因此它可以處理口語。也支援文件上傳，因此您可以上傳音訊文件，Gemini 會對其進行分析。

以下是開發人員對此功能的評價：

此更新還為開發人員帶來了更好的控制和功能，並且還支援系統指令，以便您可以輕鬆指定角色、格式和目標。

最後，還提供 JSON 模式，允許從圖像和文字中提取結構化資料。據開發人員稱，目前支援 cURL，並且即將推出 Python SDK 支援。

這還不是 Google 的全部，還有報導說 Gemini 很快就會為 Android 版 Gmail 帶來重播建議，敬請期待。

您可以上傳講座錄音，例如 Jeff Dean 的 117,000+ 代幣講座，Gemini 1.5 Pro 可以將其變成帶有答案的測驗。