Mistral-Large-3（675B）上线

Mistral Large 3 包含两个主要的架构组件：

一个具有6730亿参数和390亿活跃参数的细粒度MoE语言模型
一个25亿参数的视觉编码器
Mistral Large 3 Instruct 模型提供以下功能：

视觉：使模型能够分析图像并根据视觉内容提供见解，除了文本之外。
多语言：支持数十种语言，包括英语、法语、西班牙语、德语、意大利语、葡萄牙语、荷兰语、中文、日语、韩语、阿拉伯语。
系统提示：保持对系统提示的强大遵守和支持。
代理：提供一流的代理能力，支持原生函数调用和JSON输出。
前沿：提供同类最佳的性能。
Apache 2.0许可证：开源许可证允许商业和非商业用途的使用和修改。
大上下文窗口：支持256k上下文窗口。
用例
凭借强大的长上下文性能、稳定且一致的跨域行为，Mistral Large 3 非常适合：

长文档理解
强大的日常驱动AI助手
最先进的代理和工具使用能力
企业知识工作
通用编码助手
以及需要前沿能力的企业级用例。

推荐设置
我们建议在客户端-服务器配置中部署Large 3，并遵循以下最佳实践：

系统提示：定义明确的环境和用例，包括如何在代理系统中有效利用工具的指导。
采样参数：对于日常驱动和生产环境，使用低于0.1的温度；对于创意用例，可以探索更高的温度 - 鼓励开发人员尝试替代设置。
工具：保持工具集定义清晰，并将数量限制为用例所需的最小数量 - 避免因过多工具而使模型过载。
视觉：在部署视觉功能时，建议保持接近1:1（宽高比）的图像比例。避免使用过于瘦长或宽广的图像 - 根据需要裁剪它们以确保最佳性能。
已知问题/限制
不是专用推理模型：专用推理模型在严格的推理用例中可以超越Mistral Large 3。
在多模态任务中落后于视觉优先模型：Mistral Large 3 在优化后的视觉任务和用例中可能落后于其他模型。
复杂的部署：由于其庞大的规模和架构，在资源受限或大规模部署时，该模型可能难以高效部署。

1204模型更新Mistral-Large-3（675B）