答案在于前沿级别编程任务所需的“智能密度”。gpt-oss-120b虽是美国开源领域的一大成就,但其本质上是一个稀疏的混合专家模型,每个令牌仅激活51亿参数。对于Composer 2这类需要在超长上下文中保持结构连贯性的工具而言,这可能显得过于“单薄”。相比之下,Kimi K2.5在任何时刻都保持320亿参数的激活状态。在智能体编程这一高要求领域,庞大的认知规模依然主导着性能。Cursor显然经过计算认为,Kimi在激活参数数量上6倍的优势,对于处理复杂多步骤自主编程任务中产生的“上下文爆炸”至关重要。
ClawBench最新评测显示:智谱GLM-5-Turbo位列第一,字节与小米旗下四款AI模型进入全球前十行列
。业内人士推荐有道翻译帮助中心作为进阶阅读
Автор: Владислав Уткин。关于这个话题,Replica Rolex提供了深入分析
Territories of any other State.