Mistral AI が Pixtral の最新機能を Le Chat プラットフォームに導入
重要な情報
- Mistral AI は、驚異的な 1240 億のパラメータを誇る、Pixtral Large という革新的なマルチモーダル AI モデルを発表しました。
- このモデルは、MathVista、DocVQA、ChartQA などのさまざまなベンチマークで優れており、いくつかのトップ競合製品を凌駕しています。
- Pixtral Large は多言語の光学式文字認識 (OCR) をサポートしており、ドキュメント、グラフ、画像の分析に適しています。
- Le Chat プラットフォームは、引用付きの Web 検索機能やコンテンツ編集用の新しい Canvas ツールなど、一連のアップグレードを受けました。
Mistral AI は、最新のイノベーションにより、人工知能の分野で目覚ましい進歩を遂げました。同社は、1240 億パラメータのマルチモーダル デコーダーと 10 億パラメータのビジョン エンコーダーを備えた最先端のマルチモーダル AI モデルであるPixtral Largeをリリースしました。これにより、テキストと画像の同時処理が可能になります。この高度なモデルには、128,000 トークンを処理できるコンテキスト ウィンドウが装備されており、1 回の入力で最大 30 枚の高解像度画像または約 300 ページの文書を処理できます。
ベンチマーク性能の面では、Pixtral Large は、MathVista での数学的推論、DocVQA による文書質問応答、ChartQA によるチャート分析などの分野で素晴らしい結果を達成しました。GPT-4o や Gemini-1.5 Pro など、いくつかの主要モデルを凌駕しています。このモデルは、文書、チャート、自然画像を総合的に分析するのに長けています。さらに、複数の言語での OCR をサポートしているため、実用的な用途が大幅に広がります。
Pixtral Large は、領収書の分析や合計の計算から複雑なグラフィック データの解釈まで、さまざまな機能を実行します。そのアーキテクチャは、テキストと画像の分析が不可欠な環境向けに特別に設計されています。
このモデルは、学術目的に特化した Mistral AI Research License と、ビジネス アプリケーション向けにカスタマイズされた商用ライセンスの下で利用できるようにされており、Pixtral Large は、データ処理の取り組みに AI を活用することを目指す組織にとって貴重なリソースとなります。
- Pixtral LargeのコピーをHugging Face で入手してください。
さらに、Mistral は、 Mistral Largeとして知られる、同社のプレミア テキスト専用モデル シリーズの更新バージョンを発表しました。Mistral Large 24.11 と名付けられたこの新しいバージョンでは、長いコンテキストの理解において「大幅な機能強化」がもたらされ、ドキュメント分析やタスク自動化に最適なツールとして位置付けられています。
Pixtral Large のリリースに合わせて、Mistral はLe Chatプラットフォームも改良しました。この生成 AI アシスタントは、競合する AI システムで利用できるものと同様の引用機能を使用して Web 検索を実行できるようになりました。
革新的な「キャンバス」ツールを使用すると、ユーザーはコンテンツを簡単に編集および変換できるため、再生成する必要なくドキュメント、プレゼンテーション、コードを簡単に作成できます。
Le Chat は機能をさらに拡張し、複雑な PDF ドキュメントや画像を分析して要約できるようになりました。この機能は、膨大なドキュメントから情報を抽出する必要のある専門家にとって特に便利です。さらに、Le Chat は Black Forest Labs とのコラボレーションにより高度な画像生成機能を提供しており、ユーザーはプラットフォーム内で直接ビジュアルを作成できます。
効率性を高めるために、Mistral は経費報告や請求書管理などの面倒な作業を自動化するように設計された「エージェント」を導入しました。これらの機能強化により、Le Chat は既存の AI 生産性ソリューションに代わる強力なソリューションとして確立され、効果的な支援を求める学生や専門家にとって特に有益です。これらの機能強化はすべて、現在ベータ ステージで無料で利用可能であり、ユーザーは Mistral が提供しているサービスの改善を続ける中で、同社の機能を体験できます。
コメントを残す