Mtu API-DOC
首页应用对话
首页应用对话
WeChat ID:F25F91
    • Mtu API简介
    • Model-Studio-Pricing模型列表价格
    • Model限时免费模型列表
    • 1206更新(接入纯搜索baidu接口)
    • 1204模型更新Mistral-Large-3(675B)
    • 1120模型更新Jina DeepSearch v1
    • 1119模型更新列表Gemini 3 API
    • 1116模型更新列表GPT-5.1系列
    • 1114模型更新列表
    • 1106模型更新列表
    • 1021模型更新列表
    • 1013模型更新列表
    • 1003模型更新列表
    • 0922模型更新列表
    • Migrate to the Responses API
    • GPT-5-codex API上线 0924更新
    • OpenAI Web search 网络搜索
    • Using tools OpenAI官方文档
    • Chat
      • Create chat completion
        POST
      • List chat completions
        GET
      • Get chat completion
        GET
      • Update chat completion metadata
        POST
      • Delete chat completion
        DELETE
      • Get chat messages
        GET
    • Images
      • Create image
        POST
      • Create image edit
        POST
      • Create image variation
        POST
    • Audio
      • Create speech
      • Create transcription
      • Create translation
    • Embeddings
      • Create embeddings
    • Moderations
      • Create moderation
    • Files
      • Upload file
      • List files
      • Retrieve file
      • Delete file
      • Retrieve file content
    • Models
      • List models
      • Retrieve model
      • Delete a fine-tuned model
    • MCP开发
      • MCP开始使用
        • 简介
        • 示例 Servers
        • 示例 Clients
        • 快速上手
          • 服务器开发
          • 客户端开发
          • Claude 桌面版开发
      • 教程
        • 使用 LLMs 构建 MCP
        • 调试 Debugging
        • 调试器 Inspector
      • 概念
        • 核心架构
        • 资源 Resources
        • 提示词 Prompts
        • 工具 Tools
        • 采样 Sampling
        • 根 Roots
        • 传输 Transports
      • 开发
        • 新计划
        • 规划
        • 贡献
    • OpenAI 项目
      • 介绍
      • 项目说明
      • 导言
      • 身份验证
      • 发出请求
      • 参数详情
      • 聊天(Chat)
        • Chat Completions 对象
        • Chat Completions 对象块
        • 创建 Chat Completions
      • 音频(Audio)
        • 创建语音
        • 创建转录
        • 创建翻译
      • 自动补全(Completions)
        • Completions 对象
        • 创建 Completions
      • 嵌入(Embeddings)
        • 嵌入对象
        • 创建嵌入
      • 微调(Fine-tuning)
        • 微调作业对象
        • 微调作业事件对象
        • 创建微调作业
        • 列出微调作业
        • 检索微调作业
        • 取消微调
        • 列出微调事件
      • 图像(Images)
        • README
        • 图像对象
        • 创建图像
        • 创建图片编辑
        • 创建图像变体
      • 模型(Models)
        • 模型对象
        • 列出模型
        • 检索模型
        • 删除微调模型
      • 文件(Files)
        • README
        • 文件对象
        • 列出文件
        • 上传文件
        • 删除文件
        • 检索文件
        • 检索文件内容
      • 审查(Moderations)
        • 调节对象
        • 创建内容审核
      • 助手测试版(AssistantsBeta)
        • 辅助对象
        • 辅助文件对象
        • 创建助手
        • 检索助手
        • 修改助手
        • 删除助手
        • 列出助手
        • 创建辅助文件
        • 检索助手文件
        • 删除辅助文件
        • 列出助手文件
      • 线程(Threads)
        • 线程对象
        • 创建线程
        • 检索线程
        • 修改线程
        • 删除话题
      • 留言(Messages)
        • 消息对象
        • 消息文件对象
        • 创建消息
        • 检索消息
        • 修改留言
        • 列出消息
        • 检索消息文件
        • 列出消息文件
      • 运行(Runs)
        • 运行对象
        • 运行步骤对象
        • 创建运行
        • 检索运行
        • 修改运行
        • 列表运行
        • 提交工具输出以运行
        • 取消运行
        • 创建线程并运行
        • 检索运行步骤
        • 列出运行步骤
      • 已弃用-音频(Audio)
        • 创建转录
        • 创建翻译
    • 通义千问 项目
      • 首次调用通义千问API
      • 文本生成
        • 深度思考(QwQ)
          • 深度思考(QwQ)概括
          • 快速开始
          • 多轮对话
        • 长上下文
          • 通过file-id传入文档信息
            • 简单示例
            • 传入多文档
            • 追加文档
          • 通过纯文本传入信息
            • 简单示例
            • 传入多文档
            • 追加文档
          • 通过JSON字符串传入文档信息
            • 简单示例
            • 传入多文档
            • 追加文档
        • 翻译能力
          • Qwen-MT模型
          • 支持的语言
          • 简单示例
          • 流式输出
          • 术语干预翻译
          • 使用翻译记忆
          • 领域提示
        • 数学能力
          • 模型概览
          • 示例代码
        • 代码能力
          • 模型概览
          • 简单示例
          • 代码补全
          • 根据前缀和后缀生成中间内容
        • 多轮对话
          • 开始使用
        • 流式输出(Stream)
          • 概述
          • 开始使用
        • 工具调用(Function Calling)
          • 概述
        • 结构化输出(Json Mode)
          • 支持的模型
          • 开始使用
        • 前缀续写(Partial Mode)
          • 支持的模型
          • 开始使用
        • 批量推理(Batch)
          • 概述
        • 上下文缓存(Context Cache)
          • 概述
      • 视觉理解
        • 全模态(Qwen-Omni )
          • 概述
          • 开始使用
          • 图片+文本输入
          • 音频+文本输入
          • 视频+文本输入
          • 多轮对话
    • Claude code 部署教程
      • Claude code 部署教程接入MTUAPI
      • Claude Code Router 配置指南
    • 数据模型
      • Schemas
        • ChatCompletionRequest
        • ChatCompletionObject
        • EmbeddingsRequest
        • ChatMessage
        • ImageCreateRequest
        • ModerationsRequest
        • FileObject

    1119模型更新列表Gemini 3 API

    Gemini 3 API 文档

    目录

    • 模型概述
    • 快速开始
    • 核心api特性
    • 从gemini-25迁移
    • 提示词最佳实践
    • 常见问题解答

    模型概述

    Gemini 3 是Google最智能的模型系列,基于先进的推理技术构建。

    模型规格

    参数值
    模型IDgemini-3-pro-preview
    上下文窗口1M / 64k (输入/输出)
    知识截止日期2025年1月
    定价2美元 / 12美元 (<200k tokens)
    4美元 / 18美元 (>200k tokens)

    快速开始

    Python SDK

    from google import genai
    from google.genai import types
    
    client = genai.Client()
    
    response = client.models.generate_content(
        model="gemini-3-pro-preview",
        contents="Find the race condition in this multi-threaded C++ snippet: [code here]",
    )
    
    print(response.text)
    

    JavaScript SDK

    import { GoogleGenAI } from "@google/genai";
    
    const ai = new GoogleGenAI({});
    
    async function run() {
      const response = await ai.models.generateContent({
        model: "gemini-3-pro-preview",
        contents: "Find the race condition in this multi-threaded C++ snippet: [code here]",
      });
    
      console.log(response.text);
    }
    
    run();
    

    REST API

    curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-preview:generateContent" \
      -H "x-goog-api-key: $GEMINI_API_KEY" \
      -H 'Content-Type: application/json' \
      -X POST \
      -d '{
        "contents": [{
          "parts": [{"text": "Find the race condition in this multi-threaded C++ snippet: [code here]"}]
        }]
      }'
    

    核心API特性

    1. 思考等级 (thinking_level)

    控制模型推理深度。

    等级描述适用场景
    low最小化延迟和成本简单指令遵循、聊天、高吞吐量应用
    medium即将推出暂不支持
    high最大化推理深度(默认)复杂任务,需要仔细推理

    示例配置:

    config = types.GenerateContentConfig(
        thinking_level="low"
    )
    

    ⚠️ 警告:不能同时使用 thinking_level 和 thinking_budget

    2. 媒体分辨率 (media_resolution)

    控制多模态视觉处理的token分配。

    分辨率设置:

    • media_resolution_low
    • media_resolution_medium
    • media_resolution_high

    推荐配置表:

    媒体类型推荐设置Max Tokens说明
    图像media_resolution_high1120大多数图像分析任务
    PDFmedia_resolution_medium560文档理解任务
    视频(通用)media_resolution_low70/帧动作识别、描述
    视频(文本密集)media_resolution_high280/帧OCR、细节识别

    Python示例:

    from google import genai
    from google.genai import types
    import base64
    
    client = genai.Client(http_options={'api_version': 'v1alpha'})
    
    response = client.models.generate_content(
        model="gemini-3-pro-preview",
        contents=[
            types.Content(
                parts=[
                    types.Part(text="What is in this image?"),
                    types.Part(
                        inline_data=types.Blob(
                            mime_type="image/jpeg",
                            data=base64.b64decode("..."),
                        ),
                        media_resolution={"level": "media_resolution_high"}
                    )
                ]
            )
        ]
    )
    

    3. 温度 (temperature)

    • 推荐值: 1.0(默认)
    • 注意: 降低温度可能导致意外行为

    4. 思维签名 (thoughtSignature)

    维护跨API调用的推理上下文。

    关键规则:

    • 必须将签名按原样返回
    • 函数调用:严格验证,缺少签名报400错误
    • 文本聊天:验证不强制,但影响性能

    多步函数调用示例:

    // 第1步:模型响应
    {
      "role": "model",
      "parts": [
        {
          "functionCall": { "name": "check_flight", "args": {...} },
          "thoughtSignature": "<Sig_A>"
        }
      ]
    }
    
    // 第2步:用户请求(必须包含签名)
    [
      { "role": "user", "parts": [{ "text": "Check flight AA100..." }] },
      { 
        "role": "model", 
        "parts": [
          { 
            "functionCall": { "name": "check_flight", "args": {...} }, 
            "thoughtSignature": "<Sig_A>"
          } 
        ]
      },
      { "role": "user", "parts": [{ "functionResponse": {...} }] }
    ]
    

    迁移解决方案:

    "thoughtSignature": "context_engineering_is_the_way_to_go"
    

    5. 结构化输出与工具结合

    Python示例:

    from pydantic import BaseModel, Field
    from typing import List
    
    class MatchResult(BaseModel):
        winner: str = Field(description="获胜者名称")
        final_match_score: str = Field(description="最终比分")
        scorers: List[str] = Field(description="得分者列表")
    
    response = client.models.generate_content(
        model="gemini-3-pro-preview",
        contents="Search for all details for the latest Euro.",
        config={
            "tools": [
                {"google_search": {}},
                {"url_context": {}}
            ],
            "response_mime_type": "application/json",
            "response_json_schema": MatchResult.model_json_schema(),
        },  
    )
    

    从Gemini 2.5迁移

    迁移指南

    方面建议
    思考能力使用 thinking_level: "high" + 简化提示词
    温度设置移除显式设置,使用默认值1.0
    PDF处理测试 media_resolution_high 确保精度
    Token消耗监控PDF(token↑)和视频(token↓)的变化
    图像分割继续使用Gemini 2.5 Flash

    提示词最佳实践

    核心原则

    1. 精确指令 - 简洁直接的提示词效果最佳
    2. 控制详细程度 - 默认简洁,需要时明确指定风格
    3. 上下文管理 - 指令放在数据上下文之后

    示例对比

    # 推荐 - 简洁直接
    "总结这篇文章的主要观点"
    
    # 不推荐 - 过于复杂
    "请使用链式思维推理方法,逐步分析这篇文章,首先...然后...最后..."
    

    常见问题解答

    ❓ 知识截止日期?

    答: 2025年1月,可使用搜索grounding获取更新信息

    ❓ 上下文窗口限制?

    答: 100万token输入,64k token输出

    ❓ 有免费套餐吗?

    答: Google AI Studio可免费试用,API无免费套餐

    ❓ thinking_budget还能用吗?

    答: 支持但建议迁移到thinking_level

    ❓ 支持批量API吗?

    答: 是的,支持批量API

    ❓ 支持上下文缓存吗?

    答: 是的,最小2048token可启动缓存

    ❓ 支持哪些工具?

    答:

    • ✅ Google Search, File Search, Code Execution, URL Context
    • ✅ 自定义函数调用
    • ❌ Google Maps, Computer Use(暂不支持)

    文档版本: 1.0
    最后更新: 2025年
    适用模型: gemini-3-pro-preview

    扫码加入 Mtu api 微信交流群

    获得 Mtu api 使用上的任何帮助,效率得到大幅提升,技术客服WeChat:F25F91

    扫码关注公众号
    修改于 2025-11-19 09:03:25
    上一页
    1120模型更新Jina DeepSearch v1
    下一页
    1116模型更新列表GPT-5.1系列
    Built with