Mistral AI 將 Pixtral 的最新功能引入 Le Chat 平台
基本訊息
- Mistral AI 推出了名為 Pixtral Large 的創新多模態 AI 模型,擁有 1240 億個參數。
- 該模型在 MathVista、DocVQA 和 ChartQA 等各種基準測試中表現出色,超越了幾個頂級競爭對手。
- Pixtral Large 支援多語言光學字元辨識 (OCR),使其能夠熟練分析文件、圖表和圖像。
- Le Chat 平台進行了一系列升級,包括帶有引文的網路搜尋功能以及用於內容編輯的新 Canvas 工具。
Mistral AI 以其最新的創新在人工智慧領域取得了顯著的進展。該公司推出了Pixtral Large,這是一種最先進的多模態人工智慧模型,具有 1240 億參數多模態解碼器和 10 億參數視覺編碼器,能夠同時處理文字和圖像。此高級模型配備了能夠處理 128,000 個標記的上下文窗口,允許在一次輸入中處理多達 30 張高分辨率圖像或大約 300 頁的文檔。
在基準性能方面,Pixtral Large 在 MathVista 上的數學推理、DocVQA 的文檔問答以及 ChartQA 的圖表分析等領域取得了令人印象深刻的成績。它的性能優於多種領先型號,包括 GPT-4o 和 Gemini-1.5 Pro。該模型擅長對文件、圖表和自然圖像進行綜合分析。此外,它對多種語言 OCR 的支援大大拓寬了其實際應用範圍。
Pixtral Large 執行多種功能,從分析收據和統計總數到解釋複雜的圖形資料。其架構是專門為文字和圖像分析必不可少的環境而設計的。
該模型可根據用於學術目的的專門 Mistral AI 研究許可證以及針對業務應用程式量身定制的商業許可證進行訪問,這使得 Pixtral Large 成為旨在在數據處理工作中利用 AI 的組織的寶貴資源。
- 取得Pixtral Large的Hugging Face副本。
此外,Mistral 還推出了其主要純文字模型系列的更新版本,稱為Mistral Large。這個名為 Mistral Large 24.11 的新迭代在理解長上下文方面帶來了“顯著增強”,將其定位為文件分析和任務自動化的理想工具。
在推出 Pixtral Large 的同時,Mistral 也改進了其Le Chat平台。這種生成式人工智慧助理現在可以透過類似於競爭人工智慧系統中可用的引文功能來進行網路搜尋。
創新的「Canvas」工具可讓使用者輕鬆編輯和轉換內容,方便建立文件、簡報和程式碼,而無需重新產生。
Le Chat 進一步擴展了其功能,現在能夠分析和總結複雜的 PDF 文件和圖像。對於需要從大量文件中提取資訊的專業人士來說,此功能特別有利。此外,Le Chat 透過與 Black Forest Labs 合作提供先進的圖像生成功能,使用戶能夠在平台內創建視覺效果。
為了提高效率,米斯特拉爾引入了“代理”,旨在自動執行繁瑣的任務,例如費用報告和發票管理。這些增強功能使 Le Chat 成為現有人工智慧生產力解決方案的強大替代方案,特別有利於尋求有效幫助的學生和專業人士。所有這些改進目前在測試階段都是免費的,讓用戶能夠在公司不斷完善其產品的同時體驗 Mistral 的功能。
發佈留言