打开

首页
党政
- 党网 · 时政
- 人事
- 反腐
- 理论
- 党史
- 党建
要闻
人民锐评
互动
观点
- 社论
- 本报评论员
- 任仲平
- 任平
- 仲音
- 人民论坛
- 人民时评
- 今日谈
- 望海楼
- 金社平
- 寰宇平
- 钟声
- 和音
- 金台随笔
- 每周经济评论
- 暖闻热评
- 国际论坛
- 人民网观点
可视化
地方
- 京
- 津
- 冀
- 晋
- 蒙
- 辽
- 吉
- 黑
- 沪
- 苏
- 浙
- 皖
- 闽
- 赣
- 鲁
- 豫
- 鄂
- 湘
- 粤
- 桂
- 琼
- 渝
- 川
- 黔
- 滇
- 藏
- 陕
- 甘
- 青
- 宁
- 新
- 鹏
- 雄安
民文
English
合作网站
人工智能
客户端
无障碍
举报
登录

退出

首页>>利来手机端>>正文详情

【最新发布】

利来手机端Ling-2.6

—— 深度解析利来手机端行业新动向

编辑：青岛晟林人造草坪有限公司无锡分公司研究员

2026-05-04 | 来源：青岛晟林人造草坪有限公司无锡分公司资讯中心57032

订阅已订阅已收藏

小字号

点击播报本文，约

【TechWeb】4 月 22 日消息，今日，蚂蚁利来手机端正式发布了 Ling-2.6-flash，这是一款总参数量达到 104B、激活参数为 7.4B 的 Instruct 模型。该模型的核心理念是“Token 效率（Token Efficiency）”，旨在在保持智能竞争力的同时，实现更快的处理速度和更低的资源消耗，以更好地适应大规模的实际应用场景。

根据权威的第三方评测机构 Artificial Analysis 的数据，Ling-2.6-flash 在 Token 效率方面表现出色，通过 15M output tokens 实现了 26 分的 Intelligence Index。这一成果不仅展示了模型在智能水平上的强大能力，同时也将输出消耗控制在了相对较低的水平。与一些依赖于更长输出以获得高分的模型相比，Ling-2.6-flash 在“智能表现”与“输出成本”之间找到了更为优越的平衡。

对于开发者及企业应用而言，这种效率优势意味着更低的推理成本、更快的首字响应时间、更短的整体生成延迟，以及更为流畅的交互体验，能够满足在实际部署环境中对速度、成本和用户体验的综合需求。

Ling-2.6-flash 采用了 Ling 2.5 的混合线性架构设计，这种高度稀疏的 MoE 架构在硬件性能上展现出明显的优势。在 4 卡 H20 的条件下，推理速度最快可达 340 tokens/s，Prefill 吞吐量达到 Nemotron-3-Super 的 2.2 倍。在 Output Speed 测评中，Ling-2.6-flash 以 215 tokens/s 的稳定输出速度名列同参数级别模型的前列。

从 Token 消耗的角度来看，Ling-2.6-flash 的智效比显著提升。在 Artificial Analysis 的完整测评中，Ling-2.6-flash 的总消耗为 15M tokens，而 Nemotron-3-Super 等模型的消耗则达到或超过 110M tokens。这一数据表明，Ling-2.6-flash 仅用约 1/10 的 token 消耗便完成了同类评测任务。

在针对 Agent 场景的定向增强方面，
Ling-2.6-flash 在控制 Token 消耗的前提下，
依旧展现出强大的任务执行能力。
该模型在 BFCL-V4、TAU2-bench、SWE-bench Verified、Claw-Eval、PinchBench 等 Agent 相关基准测试中达到了同尺寸的 SOTA 水平。
同时，Ling-2.6-flash 在通用知识、数学推理、指令遵循及长文本解析等多维度上也保持了优秀的表现。

在 API 定价方面，Ling-2.6-flash 的输入费用为每百万 tokens 0.1 美元，输出费用为 0.3 美元。目前，Ling-2.6-flash 的 API 已正式向用户开放，并提供为期一周的限时免费试用。用户可以通过 OpenRouter 和利来手机端大模型 tbox 获取相应服务。据悉，该模型后续将通过蚂蚁数科推出商业版本 LingDT，面向全球开发者及中小企业提供服务。

一周前，Ling-2.6-flash 的匿名测试版本“Elephant Alpha”在 OpenRouter 上线后，其调用量持续增长，连续多日跻身 Trending 榜首，日均 tokens 调用量已达到 100B 级别，周增长率超过 5000%。

　　《深度产经观察》（ 2026年版）

(责编：KVtCE、rmVz)

分享让更多人看到