Gemini 3.1 Flash-Lite 正式上线:专为规模化智能而生
<p dir="ltr"><em>内容来源于谷歌官方,由谷歌云谷歌地图合作伙伴 CloudAce 深圳云一进行翻译发布。</em></p><p dir="ltr">导语: Google 扩展了 Gemini 3 模型家族,正式推出 <strong>Gemini 3.1 Flash-Lite</strong>。作为该系列中速度最快、性价比最高的模型,它专为应对大规模高容量的开发工作负载而设计,在模型等级与价格平衡方面树立了新的行业标杆 。</p>
<p dir="ltr">目前,开发者已可通过 Google AI Studio 中的 Gemini API 接入预览版,企业级用户则可同步通过 Vertex AI 平台进行部署 。</p>
<h3 dir="ltr">⚡ 性能更强</h3>
<p dir="ltr">在实时交互与高频工作流中,低延迟是应用成功的关键。根据最新的基准测试,Gemini 3.1 Flash-Lite 在保持甚至超越前代模型质量的同时,实现了性能的飞跃:</p>
<ul>
<li dir="ltr">
<p dir="ltr"><strong>极速响应:</strong>其首个答案 Token 生成时间(Time to First Answer Token)比 2.5 Flash 快 <strong>2.5 倍</strong> 。</p>
</li>
<li dir="ltr">
<p dir="ltr"><strong>高效输出:</strong>输出速度提升了 <strong>45%</strong> 。</p>
</li>
<li dir="ltr">
<p dir="ltr"><strong>实时体验:</strong>这种超低延迟特性使其成为构建高响应、实时交互体验的理想底座 。</p>
</li>
</ul>
<p><img alt="Gemini 3.1 Flash-Lite 在速度和质量方面都优于 2.5 Flash。" loading="lazy" style="display: block; margin-left: auto; margin-right: auto" data-src="https://img2024.cnblogs.com/blog/3075740/202603/3075740-20260310165247070-1440818104.gif" class="lazyload"></p>
<p style="text-align: center"><span style="color: rgba(128, 128, 128, 1)"><em>Gemini 3.1 Flash-Lite 在速度和质量方面都优于 2.5 Flash</em></span></p>
<h3>💰 成本更低</h3>
<p dir="ltr">对于需要处理 PB 级数据或海量用户请求的企业而言,3.1 Flash-Lite 提供了极具破坏力的定价模型,将先进智能的获取成本降至更低 :</p>
<ul>
<li dir="ltr">
<p dir="ltr"><strong>输入成本:</strong>仅需 <strong>$0.25 / 100万 tokens 。</strong></p>
</li>
<li dir="ltr">
<p dir="ltr"><strong>输出成本:</strong>仅需<strong> $1.50 / 100万 tokens 。</strong></p>
</li>
</ul>
<p><strong><img alt="微信图片_20260310144849_222_821" loading="lazy" style="display: block; margin-left: auto; margin-right: auto" data-src="https://img2024.cnblogs.com/blog/3075740/202603/3075740-20260310165406123-1055984126.png" class="lazyload"></strong></p>
<h3 dir="ltr">📊 表现更好</h3>
<p dir="ltr">Gemini 3.1 Flash-Lite 在 Arena.ai 排行榜上取得了令人印象深刻的 1432 Elo 分数,并在推理和多模态理解基准测试中超越了同级别的其他模型,包括在 GPQA Diamond 上获得 86.9% 的分数,在 MMMU Pro 上获得 76.8% 的分数——甚至超越了前几代更大的 Gemini 模型,如 2.5 Flash。</p>
<p dir="ltr"><img alt="Gemini 3.1 Flash-Lite 在 Arena.ai 排行榜表现" loading="lazy" style="display: block; margin-left: auto; margin-right: auto" data-src="https://img2024.cnblogs.com/blog/3075740/202603/3075740-20260310165447504-1464495779.png" class="lazyload"></p>
<p style="text-align: center"><span style="color: rgba(153, 153, 153, 1)"><em>Gemini 3.1 Flash-Lite 分数表现</em></span></p>
<h3 dir="ltr">🧠 自适应的规模化智能</h3>
<p dir="ltr">为了赋予开发者更精细的控制力,3.1 Flash-Lite 在 AI Studio 和 Vertex AI 中标配了<strong> “思考等级(Thinking Levels)”</strong> 功能 。开发者可以根据具体任务的复杂程度,灵活调节模型的推理深度:</p>
<ul>
<li dir="ltr">
<p dir="ltr"><strong>成本优先任务:</strong>处理海量翻译、内容审核等高重复性、大规模任务 。</p>
</li>
<li dir="ltr">
<p dir="ltr"><strong>逻辑优先任务:</strong>应对复杂的 UI/仪表盘生成、模拟创建或精准遵循复杂指令 。</p>
</li>
</ul>
<p dir="ltr">目前,已有包括 Latitude、Cartwheel 和 Whering 在内的多家先锋企业正利用 3.1 Flash-Lite 解决大规模的复杂业务挑战 。</p>
<p dir="ltr"><img alt="3.1 Flash-Lite 可瞬间为电商线框图填充数百种不同类别的产品。 (1)" loading="lazy" style="display: block; margin-left: auto; margin-right: auto" data-src="https://img2024.cnblogs.com/blog/3075740/202603/3075740-20260310165612737-496019415.gif" class="lazyload"></p>
<p style="text-align: center"><span style="color: rgba(153, 153, 153, 1)">Gemini 3.1 Flash-Lite 可瞬间为电商线框图填充数百种不同类别的产品</span></p>
<h3 dir="ltr">☁️ Cloud Ace 助力企业抢占技术红利</h3>
<p dir="ltr">Cloud Ace 是在 Google Cloud 领域拥有顶尖业绩的系统集成商,<strong>在 Google Cloud 的 Service(服务)及 Co-sell(联合销售)两大核心领域,成功获得最高等级 Diamond 合作伙伴认证 ,提供从云端架构设计、运维支持、系统开发到生成式 AI 应用的一站式服务,</strong>并为企业提供从战略规划到实施落地、到运营维护的 AX 与 DX(数字化转型)一站式支持。</p>
<p dir="ltr">Cloud Ace 集团拥有 500 多名工程师,包括多名入选 Google Cloud Partner Top Engineer 的顶尖工程师,以及大批深耕行业多年的技术专家。</p>
<p dir="ltr">凭借卓越的技术实力与服务品质,连续多年荣获 Google Cloud 年度合作伙伴、 Google Maps Platform 合作伙伴等多项认证。</p>
<span id="docs-internal-guid-83e9ff0c-7fff-31f1-b345-16df04ebdbf1">如果您希望了解如何将 Gemini 3.1 Flash-Lite 引入您的业务架构,实现从“降本增效”到“体验升级”的飞跃,欢迎咨询我们。</span><br><br>
来源:https://www.cnblogs.com/cloudace/p/19698031
頁:
[1]