蚂蚁百灵Ling-2.6-flash权重开源:1040亿参数只激活74亿,agent评测多项SOTA
据动察 Beating 监测,蚂蚁集团旗下蚂蚁百灵(Inclusion AI)正式开源 Ling-2.6-flash 权重,此前该模型仅提供 API。总参数 1040 亿,每次推理只激活 74 亿,上下文窗口 256K,MIT 许可,BF16、FP8、INT4 三个精度版本均已上线 HuggingFace 和魔搭。Ling-2.6-flash 在 Ling 2.0 基础上引入混合线性注意力,将原来的 GQA 升级为 1:7 MLA + Lightning Linear 混合架构,再加上高稀疏 MoE,推理效率明显高于同级模型:4 卡 H20 环境下生成速度最高 340 tokens/s,prefill 和 decode 吞吐峰值约为同级开源模型的 4 倍。agent 相关评测表现突出:BFCL-V4、TAU2-bench、SWE-bench Verified(61.2%)、Claw-Eval、PinchBench 多项达到或接近同级 SOTA。在 Artificial Analysis 全套评测中总 token 消耗仅 1500 万。数学方面,AIME 2026 得分 73.85%。蚂蚁百灵官网同时列出了 Ling-2.6-1T(万亿参数旗舰版)和 Ling-2.6-mini(轻量版)两款模型,但截至发稿,这两款模型的权重在 HuggingFace 上仍为未公开状态,仅 flash 系列可下载。
下一篇:没有了