九游资讯
九游娱乐科技在AI与游戏、电竞技术领域的最新研究成果、产品更新及市场趋势。我们提供真实的行业数据与专业分析,帮助玩家与开发者了解行业发展方向及技术创新。
IT之家注:Android Bench 是谷歌官方推出的安卓开发任务基准测试,用来评估不同 AI 模型在代码编写、问题解决与开发辅助方面的实际能力。
该测试更贴近真实开发场景,专门衡量 AI 模型完成安卓开发任务的能力,因此对开发者选择模型有较强参考价值。
在平均 Token 消耗量(每次基准测试包括 100 个任务,执行 10 次计算平均消耗)方面,谷歌 Gemin九游娱乐-平台官网九游娱乐-平台官网i 3.5 Flash 平均消耗 3.559 亿 Tokens,折合单次运行平均成本 147.1 美元(现汇率约合 996.1 元人民币),成为整个榜单里最贵的模型。
谷歌在 I/O 2026 上发布 Gemini 3.5 Flash 时,称其是迄今最强的 Flash 模型,并强调编码能力更稳健,也更适合 AI 智能体与复杂工作流。
谷歌还表示,这款模型在部分内部基准测试中优于 Gemini 3.1 Pro,输出速度最高可达竞争性前沿模型的 4 倍。
但 Android Bench 给出的结论并不一致,至少在真实的安卓开发任务场景里,Gemini 3.5 Flash 没有体现出应有优势。