CSF

01 — 第一性公理

公理

自然语言表达承载的信息量，远远高于符号系统。

不需要证明，只需要一句话解释，所有人都能理解——只是很多人不敢信：

不同的主体，或同一主体在不同场景下，会对一个特定的自然语言表达进行无限种可能的解读和理解。这个无限的解读空间，就是自然语言的信息量来源。

“SP-5”只能指向一个编号，不知道编号背后是什么，信息量为零。”第五个开发阶段，参谋长在这一阶段陷入了索引复杂度的困境”，对不同的读者在不同语境下会激活完全不同的理解，每一种理解都携带真实的信息。可能的解读越多，携带的信息量越大。

为什么反常识

这与大多数学科里的结论相反。传统信息论讲的是 bits/字符的压缩密度——符号系统确实能用更少字符精确表达一件事，在这个维度上信息密度更高。软件工程几十年来的核心直觉也是：精确化是美德，形式化是严谨。这些在符号世界是正确的。

但在我们这个话题里，信息量不是 bits/字符，而是对 LLM 可用的语义激活范围。LLM 原生工作在语义层，读到自然语言时激活语义解读，自动连接类比、背景、边界条件。读到符号时走格式匹配，语义层被截断。在这个维度上，自然语言远远胜过符号。

这就是公理。它挑战常识，但不需要辩护。违反它的设计会系统性失败，接受它的设计才有正确方向。

目的：无限解读的收敛器

公理说：无限解读空间 = 最大信息量。但无限解读空间是双刃剑。

解读方向有正有负，有可能准确，也可能是噪声。面对同样一段叙述，一个读者可能抓住核心意图；另一个读者可能聚焦在边缘细节，走向完全不同的方向。这是自然语言丰富性的必然代价，不是缺陷。

所以仅仅使用自然语言是不够的。完整的推导链如下：

自然语言承载无限解读空间 → 信息量最大（公理）
→ 但解读方向不确定，有正有负（推论一）
→ 需要一个控制变量，把解读方向收敛到”有用”（推论二）
→ 目的是最高效、最小的控制变量（推论三）
→ 自然语言 + 目的 = 最大语义信息量；自然语言 − 目的 = 歧义噪声（结论）

为什么说目的是”最小”的？因为在所有能收敛解读方向的控制手段中——角色设定、规则穷举、示例演示、格式约束——目的需要的信息量最低，却能让方法和资源随之确定。这个断言的完整论证在第三篇展开。

目的的作用：LLM 在注意力聚焦于一项工作时，自然语言里被目的激活的那部分语义会被充分处理；没有被目的照到的部分会被忽略或漂移。目的不是说明书，是语义激活的开关。有了目的，LLM 不需要逐条核对每个定义，模糊的部分自动收敛；没有目的，精确定义再多，LLM 依然会在下一个任务里重新漂移。

公理的预测能力

一个公理的价值，部分在于它能直接预测什么。这条公理可以预测几类常见方案的结构性失败，不需要逐一实验：

符号索引系统：把自然语言概念替换为符号编号，在格式上精确，在语义信息量上归零。LLM 在注意力聚焦于一项工作时，不会主动深入验证每个符号引用背后的含义，只能依赖符号关系快速扫描。符号索引变复杂后，四件事同时发生：错误刚性传播（一次符号错误引起广泛连锁，无法从语义上被发现）；注意力溢出（符号数量超出 AI 的有效注意力范围）；形式化幻觉（越复杂的符号体系，AI 越相信它是正确的，派生出更多符号）；封闭排斥（符号密集的文档人很难即时检查，失去了发现问题的机会）。这不是执行质量问题，是公理层面的结构性预测。

无目的的 RAG：RAG 用向量相似度检索，是形式化层的机制，目的后置——先检索，再看是否与目的相关。但公理的完整推导要求目的先行。没有目的在前，检索到的自然语言块依然是歧义噪声，信息量没有被收敛激活。更根本的是：RAG 的立场是”AI 记忆有限是需要技术克服的缺陷”，从这个立场出发，解法不断叠加更复杂的检索和记忆机制——方向与公理所指相反。

无目的的自然语言文档：自然语言本身不是答案。结论的后半句同样重要——自然语言 − 目的 = 歧义噪声。文档体积越大、内容越详细，在没有目的框架的情况下，歧义的方向就越多。这解释了为什么”写更多文档”并不能解决 AI 理解漂移的问题。

公理指明了方向：自然语言 + 目的。但要在这个方向上设计系统，先要接受两个大多数人知道、却没有真正接受的事实。这是下一篇的内容。

This site is open source. Improve this page.