CSF

01 — 第一性公理

公理

自然语言表达承载的信息量,远远高于符号系统。

不需要证明,只需要一句话解释,所有人都能理解——只是很多人不敢信:

不同的主体,或同一主体在不同场景下,会对一个特定的自然语言表达进行无限种可能的解读和理解。这个无限的解读空间,就是自然语言的信息量来源。

“SP-5”只能指向一个编号,不知道编号背后是什么,信息量为零。”第五个开发阶段,参谋长在这一阶段陷入了索引复杂度的困境”,对不同的读者在不同语境下会激活完全不同的理解,每一种理解都携带真实的信息。可能的解读越多,携带的信息量越大。


为什么反常识

这与大多数学科里的结论相反。传统信息论讲的是 bits/字符的压缩密度——符号系统确实能用更少字符精确表达一件事,在这个维度上信息密度更高。软件工程几十年来的核心直觉也是:精确化是美德,形式化是严谨。这些在符号世界是正确的。

但在我们这个话题里,信息量不是 bits/字符,而是对 LLM 可用的语义激活范围。LLM 原生工作在语义层,读到自然语言时激活语义解读,自动连接类比、背景、边界条件。读到符号时走格式匹配,语义层被截断。在这个维度上,自然语言远远胜过符号。

这就是公理。它挑战常识,但不需要辩护。违反它的设计会系统性失败,接受它的设计才有正确方向。


目的:无限解读的收敛器

公理说:无限解读空间 = 最大信息量。但无限解读空间是双刃剑。

解读方向有正有负,有可能准确,也可能是噪声。面对同样一段叙述,一个读者可能抓住核心意图;另一个读者可能聚焦在边缘细节,走向完全不同的方向。这是自然语言丰富性的必然代价,不是缺陷。

所以仅仅使用自然语言是不够的。完整的推导链如下:

自然语言承载无限解读空间 → 信息量最大(公理)
→ 但解读方向不确定,有正有负(推论一)
→ 需要一个控制变量,把解读方向收敛到”有用”(推论二)
目的是最高效、最小的控制变量(推论三)
自然语言 + 目的 = 最大语义信息量;自然语言 − 目的 = 歧义噪声(结论)

为什么说目的是”最小”的?因为在所有能收敛解读方向的控制手段中——角色设定、规则穷举、示例演示、格式约束——目的需要的信息量最低,却能让方法和资源随之确定。这个断言的完整论证在第三篇展开。

目的的作用:LLM 在注意力聚焦于一项工作时,自然语言里被目的激活的那部分语义会被充分处理;没有被目的照到的部分会被忽略或漂移。目的不是说明书,是语义激活的开关。有了目的,LLM 不需要逐条核对每个定义,模糊的部分自动收敛;没有目的,精确定义再多,LLM 依然会在下一个任务里重新漂移。


公理的预测能力

一个公理的价值,部分在于它能直接预测什么。这条公理可以预测几类常见方案的结构性失败,不需要逐一实验:

符号索引系统:把自然语言概念替换为符号编号,在格式上精确,在语义信息量上归零。LLM 在注意力聚焦于一项工作时,不会主动深入验证每个符号引用背后的含义,只能依赖符号关系快速扫描。符号索引变复杂后,四件事同时发生:错误刚性传播(一次符号错误引起广泛连锁,无法从语义上被发现);注意力溢出(符号数量超出 AI 的有效注意力范围);形式化幻觉(越复杂的符号体系,AI 越相信它是正确的,派生出更多符号);封闭排斥(符号密集的文档人很难即时检查,失去了发现问题的机会)。这不是执行质量问题,是公理层面的结构性预测。

无目的的 RAG:RAG 用向量相似度检索,是形式化层的机制,目的后置——先检索,再看是否与目的相关。但公理的完整推导要求目的先行。没有目的在前,检索到的自然语言块依然是歧义噪声,信息量没有被收敛激活。更根本的是:RAG 的立场是”AI 记忆有限是需要技术克服的缺陷”,从这个立场出发,解法不断叠加更复杂的检索和记忆机制——方向与公理所指相反。

无目的的自然语言文档:自然语言本身不是答案。结论的后半句同样重要——自然语言 − 目的 = 歧义噪声。文档体积越大、内容越详细,在没有目的框架的情况下,歧义的方向就越多。这解释了为什么”写更多文档”并不能解决 AI 理解漂移的问题。


公理指明了方向:自然语言 + 目的。但要在这个方向上设计系统,先要接受两个大多数人知道、却没有真正接受的事实。这是下一篇的内容。