应用介绍
Claude 论文量化了这种关系:苹果的评估格式要求在每个步骤输出完整的移动序列,导致二次 token 增长。如果每个序列中的移动大约需要 5 个 token,那么总 token 需求 T(N) ≈ 5(2^N - 1)^2 + C。给定分配的 token 预算,最大可解决大小完全可以通过数学公式预测,而报告的“崩溃”正好与这些物理约束一致。
Claude 论文量化了这种关系:苹果的评估格式要求在每个步骤输出完整的移动序列,导致二次 token 增长。如果每个序列中的移动大约需要 5 个 token,那么总 token 需求 T(N) ≈ 5(2^N - 1)^2 + C。给定分配的 token 预算,最大可解决大小完全可以通过数学公式预测,而报告的“崩溃”正好与这些物理约束一致。