Mtu API-DOC
首页应用对话
首页应用对话
WeChat ID:F25F91
  1. 全模态(Qwen-Omni )
  • Mtu API简介
  • Model-Studio-Pricing模型列表价格
  • Model限时免费模型列表
  • 1206更新(接入纯搜索baidu接口)
  • 1204模型更新Mistral-Large-3(675B)
  • 1120模型更新Jina DeepSearch v1
  • 1119模型更新列表Gemini 3 API
  • 1116模型更新列表GPT-5.1系列
  • 1114模型更新列表
  • 1106模型更新列表
  • 1021模型更新列表
  • 1013模型更新列表
  • 1003模型更新列表
  • 0922模型更新列表
  • Migrate to the Responses API
  • GPT-5-codex API上线 0924更新
  • OpenAI Web search 网络搜索
  • Using tools OpenAI官方文档
  • Chat
    • Create chat completion
      POST
    • List chat completions
      GET
    • Get chat completion
      GET
    • Update chat completion metadata
      POST
    • Delete chat completion
      DELETE
    • Get chat messages
      GET
  • Images
    • Create image
    • Create image edit
    • Create image variation
  • Audio
    • Create speech
    • Create transcription
    • Create translation
  • Embeddings
    • Create embeddings
  • Moderations
    • Create moderation
  • Files
    • Upload file
    • List files
    • Retrieve file
    • Delete file
    • Retrieve file content
  • Models
    • List models
    • Retrieve model
    • Delete a fine-tuned model
  • MCP开发
    • MCP开始使用
      • 简介
      • 示例 Servers
      • 示例 Clients
      • 快速上手
        • 服务器开发
        • 客户端开发
        • Claude 桌面版开发
    • 教程
      • 使用 LLMs 构建 MCP
      • 调试 Debugging
      • 调试器 Inspector
    • 概念
      • 核心架构
      • 资源 Resources
      • 提示词 Prompts
      • 工具 Tools
      • 采样 Sampling
      • 根 Roots
      • 传输 Transports
    • 开发
      • 新计划
      • 规划
      • 贡献
  • OpenAI 项目
    • 介绍
    • 项目说明
    • 导言
    • 身份验证
    • 发出请求
    • 参数详情
    • 聊天(Chat)
      • Chat Completions 对象
      • Chat Completions 对象块
      • 创建 Chat Completions
    • 音频(Audio)
      • 创建语音
      • 创建转录
      • 创建翻译
    • 自动补全(Completions)
      • Completions 对象
      • 创建 Completions
    • 嵌入(Embeddings)
      • 嵌入对象
      • 创建嵌入
    • 微调(Fine-tuning)
      • 微调作业对象
      • 微调作业事件对象
      • 创建微调作业
      • 列出微调作业
      • 检索微调作业
      • 取消微调
      • 列出微调事件
    • 图像(Images)
      • README
      • 图像对象
      • 创建图像
      • 创建图片编辑
      • 创建图像变体
    • 模型(Models)
      • 模型对象
      • 列出模型
      • 检索模型
      • 删除微调模型
    • 文件(Files)
      • README
      • 文件对象
      • 列出文件
      • 上传文件
      • 删除文件
      • 检索文件
      • 检索文件内容
    • 审查(Moderations)
      • 调节对象
      • 创建内容审核
    • 助手测试版(AssistantsBeta)
      • 辅助对象
      • 辅助文件对象
      • 创建助手
      • 检索助手
      • 修改助手
      • 删除助手
      • 列出助手
      • 创建辅助文件
      • 检索助手文件
      • 删除辅助文件
      • 列出助手文件
    • 线程(Threads)
      • 线程对象
      • 创建线程
      • 检索线程
      • 修改线程
      • 删除话题
    • 留言(Messages)
      • 消息对象
      • 消息文件对象
      • 创建消息
      • 检索消息
      • 修改留言
      • 列出消息
      • 检索消息文件
      • 列出消息文件
    • 运行(Runs)
      • 运行对象
      • 运行步骤对象
      • 创建运行
      • 检索运行
      • 修改运行
      • 列表运行
      • 提交工具输出以运行
      • 取消运行
      • 创建线程并运行
      • 检索运行步骤
      • 列出运行步骤
    • 已弃用-音频(Audio)
      • 创建转录
      • 创建翻译
  • 通义千问 项目
    • 首次调用通义千问API
    • 文本生成
      • 深度思考(QwQ)
        • 深度思考(QwQ)概括
        • 快速开始
        • 多轮对话
      • 长上下文
        • 通过file-id传入文档信息
          • 简单示例
          • 传入多文档
          • 追加文档
        • 通过纯文本传入信息
          • 简单示例
          • 传入多文档
          • 追加文档
        • 通过JSON字符串传入文档信息
          • 简单示例
          • 传入多文档
          • 追加文档
      • 翻译能力
        • Qwen-MT模型
        • 支持的语言
        • 简单示例
        • 流式输出
        • 术语干预翻译
        • 使用翻译记忆
        • 领域提示
      • 数学能力
        • 模型概览
        • 示例代码
      • 代码能力
        • 模型概览
        • 简单示例
        • 代码补全
        • 根据前缀和后缀生成中间内容
      • 多轮对话
        • 开始使用
      • 流式输出(Stream)
        • 概述
        • 开始使用
      • 工具调用(Function Calling)
        • 概述
      • 结构化输出(Json Mode)
        • 支持的模型
        • 开始使用
      • 前缀续写(Partial Mode)
        • 支持的模型
        • 开始使用
      • 批量推理(Batch)
        • 概述
      • 上下文缓存(Context Cache)
        • 概述
    • 视觉理解
      • 全模态(Qwen-Omni )
        • 概述
        • 开始使用
          POST
        • 图片+文本输入
          POST
        • 音频+文本输入
          POST
        • 视频+文本输入
          POST
        • 多轮对话
          POST
  • Claude code 部署教程
    • Claude code 部署教程接入MTUAPI
    • Claude Code Router 配置指南
  • 数据模型
    • Schemas
      • ChatCompletionRequest
      • ChatCompletionObject
      • EmbeddingsRequest
      • ChatMessage
      • ImageCreateRequest
      • ModerationsRequest
      • FileObject
  1. 全模态(Qwen-Omni )

概述

Qwen-Omni 系列模型支持输入多种模态的数据,包括视频、音频、图片、文本,并输出文本。

支持的模型#

相比于 Qwen-VL 与 Qwen-Audio 模型,Qwen-Omni 模型可以:
理解视频文件中的视觉与音频信息;
理解多种模态的数据;
在视觉理解、音频理解等能力上,Qwen-Omni 模型也表现出色。
模型名称版本上下文长度最大输入最大输出免费额度(注)
(Token数)
qwen-omni-turbo当前等同qwen-omni-turbo-2025-01-19稳定版32,76830,7202,048各100万Token(不区分模态)有效期:百炼开通后180天内
qwen-omni-turbo-latest始终等同最新快照版最新版
qwen-omni-turbo-2025-01-19又称qwen-omni-turbo-0119快照版
当免费额度用完后,输入与输出的计费规则如下:
其中,稳定版模型qwen-omni-turbo支持Batch调用,费用为以下价格的50%。注:Batch调用不支持抵扣免费额度。
**输入计费项****单价(每千 Token)**输入:文本0.0004元输入:音频0.025元输入:图片/视频0.0015元**输出计费项****单价(每千 Token)**输出:文本0.0016元(输入仅包含文本时)0.0045元(输入包含图片/音频/视频时)
计费示例:某次请求输入了1000 Token 的文本和1000 Token 的图片,输出了1000 Token 的文本,则该请求花费:0.0004元(文本输入)+ 0.0015元(图片输入)+ 0.0045元(文本输出)= 0.0064元。在Batch调用模式下,该请求花费按50%计收,为0.0032元。
音频与图片转换为Token数的规则

使用方法#

输入#

支持的输入模态#

支持以下输入组合:
文本输入
图片+文本输入
音频+文本输入
视频(包括图像列表与视频文件形式)+文本输入
无法在一个 User Message中输入多种非文本模态的数据。

输入多模态数据的方式#

输入的图片、音频、视频文件支持 Base64 编码与公网 URL 进行传入。以下示例代码均以传入公网 URL 为例,如果需要传入 Base64 编码,请参见输入 Base64 编码的本地文件。

输出#

当前仅支持以流式输出的形式调用 Qwen-Omni 模型。

支持的输出模态#

重要
当前仅支持文本输出,后续会推出音频输出功能。
输出模态由**modalities**参数控制,当前仅支持设置为["text"]。
``
输出模态**modalities**参数值
文本["text"](默认值)

扫码加入 Mtu api 微信交流群

获得 Mtu api 使用上的任何帮助,效率得到大幅提升,技术客服WeChat:F25F91

扫码关注公众号
修改于 2025-09-16 14:10:46
上一页
概述
下一页
开始使用
Built with