雙子座1.5是什麼？你需要知道什麼

2024/02/16

在周四分享的一篇部落格文章中，Google宣布發布下一代人工智慧模型 Gemini 1.5，該模型有望在性能和效率方面取得重大改進。增強功能包括處理和理解大量資訊（一次最多 100 萬個代幣）的能力。

雙子座1.5是什麼？

基於 Gemini 1.0 的成功，最新迭代採用了新的專家混合 (MoE) 架構，將 AI 模型劃分為更小的專業網路。谷歌表示，這可以在保持高性能的同時實現更有效率的處理和訓練。正因為如此，Gemini 1.5 將能夠以更好的準確性和理解性處理多模式輸入，包括文字、圖像、音訊和視訊。

新模型的顯著特徵之一是擴展的上下文視窗。雖然之前的模型只能處理最多 32,000 個代幣，但 Gemini 1.5 可以處理最多 100 萬個代幣。這使得它能夠處理、分析和推理大量文字、程式碼、視訊和音頻，即使它們是添加在單一提示中的。

擴充功能的上下文視窗解鎖了新功能：

多模態理解：此模型可以處理不同的媒體類型，例如僅根據視覺效果分析無聲電影的情節。
相關問題解決：當遇到大型程式碼庫時，Gemini 1.5 可以建議修改並解釋不同部分如何互動。

谷歌還透露，Gemini 1.5 在 87% 的任務上優於 Gemini 1.0 Pro，並且與 Gemini 1.0 Ultra 的性能相當，即使其上下文視窗更大。

訪問和可用性

Google 正在向開發者和企業客戶提供 Gemini 1.5 Pro 的有限預覽版，並提供 128,000 個代幣上下文視窗。符合條件的用戶還可以免費測試 100 萬代幣窗口，但延遲會更長。該公司還計劃在未來推出基於上下文視窗大小的定價等級。

Google 的 Gemini 1.5 Pro 展示

這是 Google 在 YouTube 上分享的視頻，該視頻通過使用 402 頁 PDF 文本和多模式提示的實時交互展示了其長上下文理解能力。此演示涉及連續記錄模型的響應，並標明響應時間。輸入 PDF（326,658 個標記）和圖像（256 個標記）的總標記數為 326,914，而文字輸入將總數增加到 327,309 個標記。

雙子座1.5是什麼？

訪問和可用性

Google 的 Gemini 1.5 Pro 展示

發佈留言 取消回覆

發佈留言取消回覆