谷歌公司推出 Gemini 3.1 Flash-LITE 模型。该模型专为开发者大规模高频工作负载设计,即日起预览版向开发者开放,内置“思考层级”;基准测试显示,该模型首个答案响应时间较 Gemini 2.5 Flash 提高 2.5 倍 2.5 倍,输出速度提升 45%;GPQA Diamond 和 MMMU Pro 测试得分均超越 GPT-5 Mini 等竞品;定价 0.25 美元/百万输入 token、1.5 美元/百万输出 token,上下文窗口最长 100 万 toke。
 
 
Back to Top