Mtu API-DOC
首页
应用对话
首页
应用对话
复制页面
Mtu API简介
MTU-API透传Gemini Claude 原生代码
Model-Studio-Pricing模型列表价格
Model限时免费模型列表
1218模型更新列表
1208更新gpt-5.1-codex-max 上线
1206更新(接入纯搜索baidu接口)
1204模型更新Mistral-Large-3(675B)
1120模型更新Jina DeepSearch v1
1119模型更新列表Gemini 3 API
1116模型更新列表GPT-5.1系列
1114模型更新列表
1106模型更新列表
1021模型更新列表
1013模型更新列表
1003模型更新列表
0922模型更新列表
Migrate to the Responses API
GPT-5-codex API上线 0924更新
OpenAI Web search 网络搜索
Using tools OpenAI官方文档
Chat
Create chat completion
POST
List chat completions
GET
Get chat completion
GET
Update chat completion metadata
POST
Delete chat completion
DELETE
Get chat messages
GET
Images
Create image
POST
Create image edit
POST
Create image variation
POST
Audio
Create speech
Create transcription
Create translation
Embeddings
Create embeddings
Moderations
Create moderation
Files
Upload file
List files
Retrieve file
Delete file
Retrieve file content
Models
List models
Retrieve model
Delete a fine-tuned model
MCP开发
MCP开始使用
简介
示例 Servers
示例 Clients
快速上手
服务器开发
客户端开发
Claude 桌面版开发
教程
使用 LLMs 构建 MCP
调试 Debugging
调试器 Inspector
概念
核心架构
资源 Resources
提示词 Prompts
工具 Tools
采样 Sampling
根 Roots
传输 Transports
开发
新计划
规划
贡献
OpenAI 项目
介绍
项目说明
导言
身份验证
发出请求
参数详情
聊天(Chat)
Chat Completions 对象
Chat Completions 对象块
创建 Chat Completions
音频(Audio)
创建语音
创建转录
创建翻译
自动补全(Completions)
Completions 对象
创建 Completions
嵌入(Embeddings)
嵌入对象
创建嵌入
微调(Fine-tuning)
微调作业对象
微调作业事件对象
创建微调作业
列出微调作业
检索微调作业
取消微调
列出微调事件
图像(Images)
README
图像对象
创建图像
创建图片编辑
创建图像变体
模型(Models)
模型对象
列出模型
检索模型
删除微调模型
文件(Files)
README
文件对象
列出文件
上传文件
删除文件
检索文件
检索文件内容
审查(Moderations)
调节对象
创建内容审核
助手测试版(AssistantsBeta)
辅助对象
辅助文件对象
创建助手
检索助手
修改助手
删除助手
列出助手
创建辅助文件
检索助手文件
删除辅助文件
列出助手文件
线程(Threads)
线程对象
创建线程
检索线程
修改线程
删除话题
留言(Messages)
消息对象
消息文件对象
创建消息
检索消息
修改留言
列出消息
检索消息文件
列出消息文件
运行(Runs)
运行对象
运行步骤对象
创建运行
检索运行
修改运行
列表运行
提交工具输出以运行
取消运行
创建线程并运行
检索运行步骤
列出运行步骤
已弃用-音频(Audio)
创建转录
创建翻译
通义千问 项目
首次调用通义千问API
文本生成
深度思考(QwQ)
深度思考(QwQ)概括
快速开始
多轮对话
长上下文
通过file-id传入文档信息
简单示例
传入多文档
追加文档
通过纯文本传入信息
简单示例
传入多文档
追加文档
通过JSON字符串传入文档信息
简单示例
传入多文档
追加文档
翻译能力
Qwen-MT模型
支持的语言
简单示例
流式输出
术语干预翻译
使用翻译记忆
领域提示
数学能力
模型概览
示例代码
代码能力
模型概览
简单示例
代码补全
根据前缀和后缀生成中间内容
多轮对话
开始使用
流式输出(Stream)
概述
开始使用
工具调用(Function Calling)
概述
结构化输出(Json Mode)
支持的模型
开始使用
前缀续写(Partial Mode)
支持的模型
开始使用
批量推理(Batch)
概述
上下文缓存(Context Cache)
概述
视觉理解
全模态(Qwen-Omni )
概述
开始使用
图片+文本输入
音频+文本输入
视频+文本输入
多轮对话
Claude code 部署教程
Claude code 部署教程接入MTUAPI
Claude Code Router 配置指南
数据模型
Schemas
ChatCompletionRequest
ChatCompletionObject
EmbeddingsRequest
ChatMessage
ImageCreateRequest
ModerationsRequest
FileObject
首页
应用对话
首页
应用对话
1204模型更新Mistral-Large-3(675B)
复制页面
Mistral Large 3 包含两个主要的架构组件:
一个具有6730亿参数和390亿活跃参数的细粒度MoE语言模型
一个25亿参数的视觉编码器
Mistral Large 3 Instruct 模型提供以下功能:
视觉:使模型能够分析图像并根据视觉内容提供见解,除了文本之外。
多语言:支持数十种语言,包括英语、法语、西班牙语、德语、意大利语、葡萄牙语、荷兰语、中文、日语、韩语、阿拉伯语。
系统提示:保持对系统提示的强大遵守和支持。
代理:提供一流的代理能力,支持原生函数调用和JSON输出。
前沿:提供同类最佳的性能。
Apache 2.0许可证:开源许可证允许商业和非商业用途的使用和修改。
大上下文窗口:支持256k上下文窗口。
用例
凭借强大的长上下文性能、稳定且一致的跨域行为,Mistral Large 3 非常适合:
长文档理解
强大的日常驱动AI助手
最先进的代理和工具使用能力
企业知识工作
通用编码助手
以及需要前沿能力的企业级用例。
推荐设置
我们建议在 客户端-服务器配置中部署Large 3,并遵循以下最佳实践:
系统提示:定义明确的环境和用例,包括如何在代理系统中有效利用工具的指导。
采样参数:对于日常驱动和生产环境,使用低于0.1的温度;对于创意用例,可以探索更高的温度 - 鼓励开发人员尝试替代设置。
工具:保持工具集定义清晰,并将数量限制为用例所需的最小数量 - 避免因过多工具而使模型过载。
视觉:在部署视觉功能时,建议保持接近1:1(宽高比)的图像比例。避免使用过于瘦长或宽广的图像 - 根据需要裁剪它们以确保最佳性能。
已知问题/限制
不是专用推理模型:专用推理模型在严格的推理用例中可以超越Mistral Large 3。
在多模态任务中落后于视觉优先模型:Mistral Large 3 在优化后的视觉任务和用例中可能落后于其他模型。
复杂的部署:由于其庞大的规模和架构,在资源受限或大规模部署时,该模型可能难以高效部署。
扫码加入 Mtu api 微信交流群
获得 Mtu api 使用上的任何帮助,效率得到大幅提升,技术客服WeChat:F25F91
扫码关注公众号
修改于
2025-12-04 14:46:55
上一页
1206更新(接入纯搜索baidu接口)
下一页
1120模型更新Jina DeepSearch v1