AI 与智能

大语言模型到底在“想”什么?看清它什么时候靠谱、什么时候在编

你每天都在用它,却很少有人告诉你:它给答案时并没有去查资料。把这件事看明白,你就能一眼分出哪些回答可以直接用,哪些必须自己核。

方屿作者方屿
判断框架:哪些活能直接交给 AI,哪些必须自己核判断框架把 AI 的活儿分两类可以直接交给它必须自己核一遍润色、改写、换种说法头脑风暴、列提纲翻译、总结你给的材料写代码草稿(跑一遍)!具体数字、统计、价格!人名、日期、引文、出处!法律、医疗、投资决定!最近几天的事(看联网)尺度:语言活放心交给它,事实活必须自己核。
判断框架:语言活可以放心交给 AI,事实活必须自己核一遍。

有人把大模型说成“会思考的智能”,也有人贬它是“高级复读机”,吵得不可开交。两边都没说到点子上。这篇不卖关子,先把它内部真正在做的事讲清楚,再给你一张“哪些活能交给它、哪些必须自己核”的对照表,和一套拿到任何回答都能用的三步自检法。读完,你对它的判断会比绝大多数天天用它的人都准。

这篇适合你,如果

  • 你天天用 AI,但说不清它到底怎么得出答案
  • 你被它“一本正经的胡说”坑过,想知道怎么提前识别
  • 你想判断一个 AI 回答能不能直接拿去用

这篇不适合你,如果

  • 你想要的是调参、微调、写提示词的实操手册
  • 你要的是数学推导和论文级的严谨定义
  • 你只想问“哪个模型最强”这种排行榜问题

直接说结论:它是在“高级接话”,不是查资料

说穿了就一句:你向大模型提问时,它并没有去翻数据库,也没有默认上网搜。它做的事,本质上是“接话”。你给一段文字,它逐字预测“下一个最该出现的字是什么”,预测出来接上去,再拿更长的一段去预测下一个字。一段通顺的回答,就是这样几十上百次接龙拼出来的。

这个设定听起来弱,弱到不像能写代码、能讲笑话、能帮你改简历。但正因为目标只有“把话接得自然”这一个,它被逼着把语法、常识、推理的套路、不同语言之间的对应,全都顺带学了进去。理解了“接话”这两个字,后面所有现象,包括它为什么强、为什么会编,你都能自己推出来。

第一步,它把你的话切成块、变成坐标

模型不认识汉字,也不认识字母,它只认识数字。所以你的话进去后第一件事,是被切成一小块一小块,这种小块叫 token,可能是一个词、半个词或一个标点。每一块再被换成一长串数字。你可以把这串数字想成这个词在一张巨大“语义地图”上的坐标。

这张地图的妙处在于:意思相近的词,坐标也相近。“国王”和“女王”离得近,“巴黎”到“法国”的方向,和“东京”到“日本”的方向几乎平行。模型不是背下了“巴黎是法国首都”这句话,而是把这种关系编码进了坐标的几何里。理解这一点,你就能猜到它为什么有时聪明得吓人,有时又会把两个相近的概念悄悄搞混。

训练教会它的,是“什么后面通常跟什么”

训练的过程,说穿了就是给模型看海量文本,每次遮住下一个词让它猜,猜错了就微调内部成千上亿个参数,让它下次猜得准一点。这件事重复几万亿次,它内部就沉淀下了语言里几乎所有的统计规律:哪个词后面大概率跟哪个词、哪种句式用来讲道理、哪种语气用来安慰人。

关键在于,它学到的是“通常”,不是“真假”。训练数据里“地球是圆的”出现得多,它就学会顺着这句话往下接;可如果某个错误说法在网上也流传很广,它照样会接得很顺。它内部没有一个“事实核查”的开关,只有一个“这样接最自然”的直觉。这就是后面所有麻烦的根。

把它想成一个读遍了全网、语感极好,却从不核对来源的人。它的强项是“说得对路”,不是“说得属实”。

注意力:它凭什么读懂你的一长段话

接话的时候,不是每个字都同等重要。读到“他把那本方屿写的书还给了图书馆”,要预测“图书馆”,模型得知道重点在“还给”和“书”,而不是“方屿”。让它学会“该重点看哪几个词”的机制,叫注意力,也是当代主流模型那个字母 T(Transformer)的核心。

注意力让模型在每一步都重新掂量:这句话里,哪些词跟我现在要猜的词关系最大,就多看它们一眼。正是这套机制,让它能处理很长的上下文、记住前文提过的人名、把一个复杂长句的主谓宾对应清楚。你感觉它“读懂了”你那一长段话,靠的就是它。这也解释了为什么你给的上下文越清楚,它答得越好:你是在帮它把注意力放对地方。

会“想一会儿”的推理模型,又是怎么回事

这两年你可能注意到,有些模型回答前会先“想一会儿”,把思路一步步列出来再给结论。这类“推理模型”并没有换一套大脑,它还是在接话,只不过被训练成:先把中间的推理过程也写出来,再基于这些写出来的步骤继续接。

为什么这样更准?因为把一道难题拆成一串小步骤,每一步都比一步到位更容易接对,错误也更容易在中途被自己发现。这对数学、逻辑、多步骤规划帮助明显。但要清醒一点:它写出来的“思考过程”同样是接出来的话,不等于它内部真的这样想。看着像推理,不代表步步为真,结论照样要核。

幻觉为什么修不干净

到这里,“幻觉”是怎么来的,你应该能自己推出来了。既然它唯一的目标是把话接得自然,那当它不知道某个事实时,它不会停下来说“我不确定”,而是顺着语感编一个最像那么回事的答案。一个不存在的论文标题、一个看着很合理的法条编号、一个查无此人的引文,对它来说,和真实信息一样“接得顺”。

所以幻觉不是某个能单独修掉的 bug,而是“按语感接话”这件事的天然副作用。工程上有很多办法压低它:让它先检索真实资料再回答(也就是你常听到的 RAG)、训练它在没把握时承认不知道、把推理摊开写出来。这些都管用,但没有一个能把幻觉降到零。它语气最笃定的时候,恰恰可能是它编得最顺的时候。

记住这条:模型的“自信”和它的“正确”之间,没有任何必然联系。把它的笃定语气当成可信度的信号,是新手最容易踩的坑。

一张表:哪些活能放心交给它,哪些必须自己核

原理讲完,落到实处。规律其实很简单:凡是“怎么说、怎么写、换个角度”这类语感主场的活,放心交给它;凡是“具体的、可被查证的事实”,一律默认它可能在编。下面这张表,是我自己用 AI 时心里的那把尺。

任务能不能直接用为什么
润色、改写、换一种说法可以纯语感活,它的主场
头脑风暴、列提纲、起草框架可以要的是发散,不要求字字属实
翻译、总结你提供的材料基本可以原料是你给的,核对范围小
写代码草稿、解释报错可以,但要跑一遍能不能跑,运行一下就知道
具体数字、统计、价格必须核它最爱编、也最难自查的地方
人名、日期、引文、出处必须核编得逼真,一查就穿帮
法律、医疗、投资等重大决定别只信它错了代价大,务必找专业来源
最近几天刚发生的事看是否联网没联网时它只有旧记忆

拿到一个回答,三步自检

不用记复杂规则,每次拿到一个重要回答,过一遍下面三关就够了。

  • 这个回答里有没有具体的数字、人名、日期、引文、法条?只要有,默认它可能在编,标记出来。
  • 直接让它把出处列出来,再自己去权威页面对一遍。编出来的出处往往一查就没有。
  • 问自己一句:这件事错了,代价大不大?代价大的,就只把它当草稿,最终结论靠自己或专业来源定。

嫌每次记不住?这套判断做成了一个小工具:AI 回答可信度自检,回答四个问题就给你结论。

关于大模型,几个最常见的误解

它每次都是联网搜了才回答的。

多数情况下它只是凭训练时的旧记忆接话,除非你明确开了联网或它本身带检索。问“今天”的事,先确认它能不能上网。

它说得越笃定,就越可信。

语气和正确率没有关系。它编的时候同样底气十足。把笃定当可信,是最危险的习惯。

它会永远记住我跟它说过的每句话。

它只在当前这段对话的“上下文窗口”里有记忆,超出窗口的早期内容会被挤掉,除非产品另做了长期记忆。

参数越多,模型一定越聪明。

参数规模只是一个维度。训练数据的质量、训练方法和对齐做得好不好,同样决定上限。小而精的模型常常打得过大而糙的。

常见问题

我跟它聊的内容,会被拿去训练吗?

看产品和你的设置。很多服务默认会用对话改进模型,但通常提供关闭开关,企业版一般默认不用于训练。涉及隐私或机密的内容,最稳妥的做法是先去设置里关掉数据共享,或干脆不输入。

同一个问题,为什么每次答得都不一样?

因为它在“下一个词”的多个候选里是带一点随机性挑选的,这个随机度常被叫做 temperature。调低会更稳定保守,调高会更发散有创意。这也是为什么它不是一台每次输出都一样的机器。

它到底会不会做数学?

简单算术它常出错,因为本质还是在“接”一个看起来对的数字。但接了计算器、代码工具或用了推理模型之后,会可靠很多。重要计算,让它调工具或自己复核,别直接信它心算。

“上下文窗口”是什么意思,越大越好吗?

就是它一次能“看在眼里”的文字总量,超出的部分它就看不到了。窗口大,能喂给它更长的文档;但窗口大不等于它真把每个字都用好,关键信息放在显眼位置,仍然比指望它自己大海捞针靠谱。

普通电脑能自己跑一个大模型吗?

能跑一些开源的小模型,用现成的本地工具就行,好处是隐私和离线。但效果通常不如顶级在线模型,且吃显存。想体验“数据不出本机”的感觉可以试,想要最强能力还得用在线的。

资料来源与延伸

  • 论文预印本平台 arxiv.org,大模型相关研究的一手出处
  • 开源模型与数据社区 huggingface.co,可查具体模型的说明卡
  • Google DeepMind deepmind.google,注意力机制与 Transformer 的研究方

更新记录:2026 年 6 月 18 日首发。本次补充了“推理模型如何工作”一节、任务对照表和三步自检清单。后续会按主流模型能力变化更新对照表。

方屿
方屿 · 未来观察主编

做了十年科技记者,跑过实验室、发布会和一线访谈,也被各种“颠覆性”宣传忽悠过。开「看懂未来」专栏,专门把被讲复杂、或被讲浮夸的技术,还原成普通人能判断的样子。了解更多