应用介绍
这意味着所有模型在超过 13 个盘子时准确率都会变为零,纯粹是因为它们无法输出那么多内容。@scaling01 计算出,在没有任何推理空间的情况下,最大可解决大小为:DeepSeek 12 个盘子,Sonnet 3.7 和 o3-mini 13 个盘子。当实际观察模型输出时会发现,如果问题变得太大,模型甚至不会对问题进行推理,而是直接表示“由于移动次数庞大,我将解释解决方法而不是逐一列出所有 32,767 次移动”。
这意味着所有模型在超过 13 个盘子时准确率都会变为零,纯粹是因为它们无法输出那么多内容。@scaling01 计算出,在没有任何推理空间的情况下,最大可解决大小为:DeepSeek 12 个盘子,Sonnet 3.7 和 o3-mini 13 个盘子。当实际观察模型输出时会发现,如果问题变得太大,模型甚至不会对问题进行推理,而是直接表示“由于移动次数庞大,我将解释解决方法而不是逐一列出所有 32,767 次移动”。