0. 序言:打破黑盒的幻象
——在硅基的荒原上,听见数学的轰鸣 0.1 那个 20GB 的文件是什么? 当你打开电脑,双击那个名为 Llama-3-70B.gguf 或 Qwen3.5-35B-int4 的模型文件时,你面对的是什么? 在大多数人的屏幕上,它是一个无所不知的智者,一位耐心的导师,甚至是一个会写诗、会编程、会安慰人的数字伴侣。它似乎拥有灵魂,拥有情感,甚至拥有某种我们无法参透的"意识"。人们惊叹于它的回答,恐惧于它的潜力,争论着它是否会取代人类。 媒体用它做封面故事,资本用它做估值叙事,政客用它做竞选话题。它被神化,被魔化,被赋予各种超越其本质的意义。 然而,作为一名理性的探索者,作为这本书的读者,我希望你暂时忘掉这一切。 请把目光穿透那层光鲜亮丽的聊天界面,穿透那些拟人化的"思考中…“提示符,直抵它的物理本质。 在那里,没有神经元,没有突触,没有多巴胺,更没有所谓的"灵魂”。 在那里,只有矩阵(Matrix)。 躺在你硬盘里的,不过是一个 20GB 大小的二进制文件,一堆静止的、冰冷的参数。它们是 350 亿个浮点数,整齐地排列在高维空间的坐标系中,像一座沉默的数学迷宫。每一个参数都是一个可调节的旋钮,每一个旋钮都曾在训练过程中被梯度下降算法反复拧动,直到找到那个能让预测误差最小的位置。 这个文件不会"思考",不会"理解",不会"感受"。它只是静静地躺在那里,等待着被加载到 GPU 的显存中,等待着电流穿过那些硅制的晶体管,等待着矩阵乘法在万亿次每秒的速度下疯狂运转。 但是,奇迹恰恰就发生在这里。 当我们给这堆冰冷的数字通上电,将人类的语言转化为向量(Vector)注入其中,让电流驱动着矩阵乘法在 GPU 的硅晶圆上疯狂运转时——意义(Meaning) 诞生了,逻辑(Logic) 涌现了,智能(Intelligence) 苏醒了。 输入"今天天气真好",输出"我们去公园散步吧"。 输入"1+1=",输出"2"。 输入"请帮我写一首关于春天的诗",输出"春风拂过柳梢头,万物复苏绿满丘…"。 这不是魔法。这是数学。 更准确地说,这是线性代数、微积分、概率论三者交汇的产物。是 350 亿个参数在高维空间中的协同舞蹈。是梯度下降在损失函数曲面上雕刻出的最优路径。是信息压缩到极限后涌现出的生成能力。 这不仅仅是工程学的胜利,这是毕达哥拉斯主义在 21 世纪最宏伟的回响。 公元前 6 世纪,毕达哥拉斯学派提出:“万物皆数”(All is number)。他们认为,宇宙的本质不是物质,而是数学关系。音乐的和谐是弦长比例的体现,行星的运动是几何轨道的演绎,世界的秩序是数字关系的表达。 这个思想在之后的 2500 年里,被一次次验证。 牛顿用微积分描述了天体运动,麦克斯韦用方程组统一了电磁现象,爱因斯坦用张量分析重构了时空概念,量子力学用希尔伯特空间描述了微观世界。 今天,我们用 Transformer 架构描述了人类语言。 “万物皆数”,这句古老的箴言,在人工智能时代获得了新的生命。 0.2 祛魅:从神话回归算术 本书的写作初衷,是一场**“祛魅” (Disenchantment)** 之旅。 “祛魅"这个词,来自德国社会学家马克斯·韦伯。他用这个词描述现代社会的一个核心特征:随着科学理性的发展,世界逐渐失去了神秘的光环,一切现象都可以用因果关系来解释,不再有不可知的魔力。 人工智能,尤其是大语言模型,是当代最后几个尚未被完全"祛魅"的领域之一。 公众对它的认知,充斥着各种隐喻和误解: “它像人脑一样思考”——不,它没有神经元,只有矩阵乘法 “它理解语言的含义”——不,它学习的是统计规律,不是语义本体 “它会越来越聪明,最终超越人类”——不,它只是在优化预测下一个 Token 的概率 “它是黑盒,没人知道它怎么工作”——不,每一层、每一个参数、每一次计算都是可解释的 在过去的一段时间里,我们进行了数十次深度的对话。我们剥离了"人工智能"这个词汇上附着的科幻色彩,试图用最朴素的数学直觉去回答那些最深刻的问题。提问者不是被动接受知识,而是不断追问本质、挑战假设、建立连接。回答者也不是简单复述教科书,而是从第一性原理出发,层层拆解,直抵核心。 对话的核心问题包括: ...