从Skyline到Claude 3,以及作家江南

(一)

Dario Amodei,Anthropic的CEO、当今AI安全领域的执牛耳者,曾经竟是蛋白质组学当家软件Skyline的核心开发成员之一。

Skyline 本质上就是个高级过滤器,也是个精准的概率裁判。它的核心任务是在高维质谱数据里锁定研究目标、校准实验误差,最终回答一个核心问题:这个谱峰,到底是不是我们要找的信号?做这份工作,需要一种近乎苛刻的专业直觉。比如两个挨得极近的峰,是同一个分子的不同同位素峰,还是两种完全不同的物质?一个矮胖的隆起,是基线漂移的干扰,还是某个低丰度蛋白的微弱痕迹?Amodei 曾在采访里打过一个比方:这就像在宇宙微波背景辐射的嘶嘶声中,试图分辨出外星文明发来的、有规律的摩斯电码。的确,他面对的不仅仅是数据,更是一个充满不确定性的、高维的、黑箱般的复杂系统。这种在绝对混沌中建立秩序、在连续谱上划定“是”与“否”的边界训练,或许也成了他思维中不可磨灭的印记。

当Amodei离开质谱实验室,投身AI并最终创立Anthropic时,他面临的挑战在规模上放大了万亿倍,但在结构上却惊人地相似:他需要处理的不再是质谱数据,而是整个互联网的文本;他需要理解和塑造的不再是蛋白质,而是拥有万亿参数、行为如同黑箱的大型语言模型。核心问题依然如故:如何从一片混沌且充满有害信息的“噪声”中,定义并提取出我们想要的、安全的、有益的信号

他给出的答案是:宪法AI。这套优雅的方法,其核心思维居然与质谱分析有同构性:大模型根据提示词生成初始回答,如同质谱仪对样本产生原始谱图——充满潜力,但也布满噪声和不可靠的“碎片”。AI不是等待人类贴标签,而是依据一套预设的、抽象的原则,对自己的回答进行审视和批评。这似乎也可以匹配上“碎片离子鉴定”的逻辑:用一套理想的、理论上的“好答案”应具备的特征,去扫描和匹配自己刚刚生成的、粗糙的实测谱图。最后,再基于理性批判,修改和优化自己的回答。这个过程可以反复进行,直到输出达到“宪法”的标准。这正如质谱分析中,软件综合多个离子碎片、排除假阳性,经过多轮验证,最终输出一份可通过确定错误发现率的报告。或许,Skyline教会Amodei的不是某个蛋白质的序列,而是一套在无法直接观测的复杂系统里,通过设计精密的、可迭代的规则流程,从噪声中提取可靠信号的方法论。同一套思维,为超级智能对齐了人类价值观。

(二)

这让笔者不由得想起同乡江南(杨治)。

江南肄业于华盛顿大学,师从质谱巨擘Michael Gross。他的研究方向是质谱裂解行为,观察一个分子在能量冲击下,会优先从哪些化学键断裂,产生哪些特征性的碎片。这工作需要一种“侦探”思维:先人脑推演化学键的强弱,预测断裂模式,再与实验图谱相互印证。

他转型为幻想作家,把一个虚构宇宙,像解构生物分子那样,拆成最基础的构成单元和底层规则,就像分子的化学键,或是《龙族》里的言灵法则;再顺着这些规则,重构出千丝万缕的情节和人物命运,一如从裂解碎片还原出分子的完整图谱。路明非爆血后的言灵觉醒,楚子航对 “君焰” 的精准操控,读来总觉得像极了特定分子在特定能量输入下,产生的那些可预测、可解析的特征反应。从质谱实验室到卡塞尔学院的虚构世界,江南完成了一次思维工具的华丽转场。

(三)

笔者感受到一种强大且自洽的“元能力”。

首先,研究者永远看不到分析物本身,能看到的只有仪器转换后的间接信号:电信号和转换后的一张张图谱而已。你必须彻底理解并信任手里的整个工具链,从样品前处理、色谱分离,到质谱检测、数据分析,一步都不能含糊。这种 “通过工具认识世界” 的体验,跟如今我们试着通过提示词和输出来理解、塑造 AI黑箱,逻辑几乎一模一样。

再者,信号与噪声的界限永远是模糊的、概率的、需要结合上下文判断的。没有绝对的阈值,只有更优的判据。这种在高维不确定性中做决策的“手感”,恰恰是应对现实世界那些内容安全、AI伦理等模糊地带的绝佳预演。

最后,质谱固然是复杂系统,但它终究是一套层层电子元件嵌套的、多套分析理论框定的理性复杂系统。质谱学家本就是在学习理解和驾驭这类被明确规则约束的复杂系统;而如今构建 AI 安全框架,本质上也是循着这套核心思路,为 AI 这种更具自主行为性、不确定性的复杂智能系统,打造一套能有效约束行为并引导输出的上层规则体系。

所以,当我们惊叹于Claude 3回答的精准与安全,或是沉醉于龙族世界的宏大与自洽时,我们或许也在间接感受着来自质谱实验室的遥远回响。这是一种特殊的听力训练。成功者们从聆听分子破碎的微观声响出发,一个走向了为机器智能立规的科技前沿,一个走进了为人类心灵造梦的文学殿堂。如果你也正尝试解码精微世界的振动,那么或许,你也获得了理解更宏大喧嚣的密码。