Mtu API-DOC
首页应用对话
首页应用对话
WeChat ID:F25F91
    • Mtu API简介
    • Model-Studio-Pricing模型列表价格
    • Model限时免费模型列表
    • 1206更新(接入纯搜索baidu接口)
    • 1204模型更新Mistral-Large-3(675B)
    • 1120模型更新Jina DeepSearch v1
    • 1119模型更新列表Gemini 3 API
    • 1116模型更新列表GPT-5.1系列
    • 1114模型更新列表
    • 1106模型更新列表
    • 1021模型更新列表
    • 1013模型更新列表
    • 1003模型更新列表
    • 0922模型更新列表
    • Migrate to the Responses API
    • GPT-5-codex API上线 0924更新
    • OpenAI Web search 网络搜索
    • Using tools OpenAI官方文档
    • Chat
      • Create chat completion
        POST
      • List chat completions
        GET
      • Get chat completion
        GET
      • Update chat completion metadata
        POST
      • Delete chat completion
        DELETE
      • Get chat messages
        GET
    • Images
      • Create image
        POST
      • Create image edit
        POST
      • Create image variation
        POST
    • Audio
      • Create speech
      • Create transcription
      • Create translation
    • Embeddings
      • Create embeddings
    • Moderations
      • Create moderation
    • Files
      • Upload file
      • List files
      • Retrieve file
      • Delete file
      • Retrieve file content
    • Models
      • List models
      • Retrieve model
      • Delete a fine-tuned model
    • MCP开发
      • MCP开始使用
        • 简介
        • 示例 Servers
        • 示例 Clients
        • 快速上手
          • 服务器开发
          • 客户端开发
          • Claude 桌面版开发
      • 教程
        • 使用 LLMs 构建 MCP
        • 调试 Debugging
        • 调试器 Inspector
      • 概念
        • 核心架构
        • 资源 Resources
        • 提示词 Prompts
        • 工具 Tools
        • 采样 Sampling
        • 根 Roots
        • 传输 Transports
      • 开发
        • 新计划
        • 规划
        • 贡献
    • OpenAI 项目
      • 介绍
      • 项目说明
      • 导言
      • 身份验证
      • 发出请求
      • 参数详情
      • 聊天(Chat)
        • Chat Completions 对象
        • Chat Completions 对象块
        • 创建 Chat Completions
      • 音频(Audio)
        • 创建语音
        • 创建转录
        • 创建翻译
      • 自动补全(Completions)
        • Completions 对象
        • 创建 Completions
      • 嵌入(Embeddings)
        • 嵌入对象
        • 创建嵌入
      • 微调(Fine-tuning)
        • 微调作业对象
        • 微调作业事件对象
        • 创建微调作业
        • 列出微调作业
        • 检索微调作业
        • 取消微调
        • 列出微调事件
      • 图像(Images)
        • README
        • 图像对象
        • 创建图像
        • 创建图片编辑
        • 创建图像变体
      • 模型(Models)
        • 模型对象
        • 列出模型
        • 检索模型
        • 删除微调模型
      • 文件(Files)
        • README
        • 文件对象
        • 列出文件
        • 上传文件
        • 删除文件
        • 检索文件
        • 检索文件内容
      • 审查(Moderations)
        • 调节对象
        • 创建内容审核
      • 助手测试版(AssistantsBeta)
        • 辅助对象
        • 辅助文件对象
        • 创建助手
        • 检索助手
        • 修改助手
        • 删除助手
        • 列出助手
        • 创建辅助文件
        • 检索助手文件
        • 删除辅助文件
        • 列出助手文件
      • 线程(Threads)
        • 线程对象
        • 创建线程
        • 检索线程
        • 修改线程
        • 删除话题
      • 留言(Messages)
        • 消息对象
        • 消息文件对象
        • 创建消息
        • 检索消息
        • 修改留言
        • 列出消息
        • 检索消息文件
        • 列出消息文件
      • 运行(Runs)
        • 运行对象
        • 运行步骤对象
        • 创建运行
        • 检索运行
        • 修改运行
        • 列表运行
        • 提交工具输出以运行
        • 取消运行
        • 创建线程并运行
        • 检索运行步骤
        • 列出运行步骤
      • 已弃用-音频(Audio)
        • 创建转录
        • 创建翻译
    • 通义千问 项目
      • 首次调用通义千问API
      • 文本生成
        • 深度思考(QwQ)
          • 深度思考(QwQ)概括
          • 快速开始
          • 多轮对话
        • 长上下文
          • 通过file-id传入文档信息
            • 简单示例
            • 传入多文档
            • 追加文档
          • 通过纯文本传入信息
            • 简单示例
            • 传入多文档
            • 追加文档
          • 通过JSON字符串传入文档信息
            • 简单示例
            • 传入多文档
            • 追加文档
        • 翻译能力
          • Qwen-MT模型
          • 支持的语言
          • 简单示例
          • 流式输出
          • 术语干预翻译
          • 使用翻译记忆
          • 领域提示
        • 数学能力
          • 模型概览
          • 示例代码
        • 代码能力
          • 模型概览
          • 简单示例
          • 代码补全
          • 根据前缀和后缀生成中间内容
        • 多轮对话
          • 开始使用
        • 流式输出(Stream)
          • 概述
          • 开始使用
        • 工具调用(Function Calling)
          • 概述
        • 结构化输出(Json Mode)
          • 支持的模型
          • 开始使用
        • 前缀续写(Partial Mode)
          • 支持的模型
          • 开始使用
        • 批量推理(Batch)
          • 概述
        • 上下文缓存(Context Cache)
          • 概述
      • 视觉理解
        • 全模态(Qwen-Omni )
          • 概述
          • 开始使用
          • 图片+文本输入
          • 音频+文本输入
          • 视频+文本输入
          • 多轮对话
    • Claude code 部署教程
      • Claude code 部署教程接入MTUAPI
      • Claude Code Router 配置指南
    • 数据模型
      • Schemas
        • ChatCompletionRequest
        • ChatCompletionObject
        • EmbeddingsRequest
        • ChatMessage
        • ImageCreateRequest
        • ModerationsRequest
        • FileObject

    1204模型更新Mistral-Large-3(675B)

    Mistral Large 3 包含两个主要的架构组件:
    一个具有6730亿参数和390亿活跃参数的细粒度MoE语言模型
    一个25亿参数的视觉编码器
    Mistral Large 3 Instruct 模型提供以下功能:
    视觉:使模型能够分析图像并根据视觉内容提供见解,除了文本之外。
    多语言:支持数十种语言,包括英语、法语、西班牙语、德语、意大利语、葡萄牙语、荷兰语、中文、日语、韩语、阿拉伯语。
    系统提示:保持对系统提示的强大遵守和支持。
    代理:提供一流的代理能力,支持原生函数调用和JSON输出。
    前沿:提供同类最佳的性能。
    Apache 2.0许可证:开源许可证允许商业和非商业用途的使用和修改。
    大上下文窗口:支持256k上下文窗口。
    用例
    凭借强大的长上下文性能、稳定且一致的跨域行为,Mistral Large 3 非常适合:
    长文档理解
    强大的日常驱动AI助手
    最先进的代理和工具使用能力
    企业知识工作
    通用编码助手
    以及需要前沿能力的企业级用例。
    推荐设置
    我们建议在客户端-服务器配置中部署Large 3,并遵循以下最佳实践:
    系统提示:定义明确的环境和用例,包括如何在代理系统中有效利用工具的指导。
    采样参数:对于日常驱动和生产环境,使用低于0.1的温度;对于创意用例,可以探索更高的温度 - 鼓励开发人员尝试替代设置。
    工具:保持工具集定义清晰,并将数量限制为用例所需的最小数量 - 避免因过多工具而使模型过载。
    视觉:在部署视觉功能时,建议保持接近1:1(宽高比)的图像比例。避免使用过于瘦长或宽广的图像 - 根据需要裁剪它们以确保最佳性能。
    已知问题/限制
    不是专用推理模型:专用推理模型在严格的推理用例中可以超越Mistral Large 3。
    在多模态任务中落后于视觉优先模型:Mistral Large 3 在优化后的视觉任务和用例中可能落后于其他模型。
    复杂的部署:由于其庞大的规模和架构,在资源受限或大规模部署时,该模型可能难以高效部署。

    扫码加入 Mtu api 微信交流群

    获得 Mtu api 使用上的任何帮助,效率得到大幅提升,技术客服WeChat:F25F91

    扫码关注公众号
    修改于 2025-12-04 14:46:55
    上一页
    1206更新(接入纯搜索baidu接口)
    下一页
    1120模型更新Jina DeepSearch v1
    Built with