为什么AI翻译有时会翻车

你有没有想过，当我们在翻译软件里输入一句“我爱机器学习”时，屏幕对面那个复杂的神经网络模型，到底经历了怎样的心理斗争，才输出了那句完美的法语“J’aime le machine learning”？

其实，生成这句话的过程，就像是在走一个巨大的迷宫。

今天，我们就来聊聊在这个迷宫里，AI是如何做选择的。我们会认识三位性格迥异的“向导”：贪心搜索、穷举搜索和今天的主角——束搜索。

想象一下，你在爬一座群山环绕的大山，你的目标是爬到最高点。

贪心搜索就像是一个极度短视的登山者。他每走一步，只盯着脚下的路，哪条路看起来最陡、上升得最快，他就往哪走。

第一步：他选了看起来最高的路。
第二步：他又选了眼前最高的路。
结果：他可能很快就爬不动了，因为他爬上了一座小土坡的顶端。虽然这里是局部最高点，但抬头一看，远处还有一座更高的山峰（全局最优解），可惜他已经陷在土坡上下不来了。

在AI翻译中，贪心搜索就是每一步只选概率最大的那个词。虽然速度极快，但很容易因为一开始选了一个“看似完美”的词，导致后面整句话都不通顺，错过了真正最好的翻译。

既然贪心搜索不靠谱，那我们找个最稳妥的办法吧。

穷举搜索就是一个完美主义者。他站在山脚下，心想：“为了确保找到最高的山峰，我要把这座山里每一条可能的路都走一遍！”

这就像是你为了决定午饭吃什么，把全宇宙所有的菜谱都试做了一遍。虽然理论上能找到“最好吃”的那道菜，但等你算完，黄花菜都凉了。计算量太大，根本跑不动。

这时候，束搜索登场了。它就像是一个精明的探险队长，既不像贪心搜索那样只看眼前，也不像穷举搜索那样傻乎乎地全跑一遍。

它的策略是：手里永远攥着 k 张藏宝图。

假设我们设定束宽 $k=2$（也就是手里永远保留2个最好的选择）：

第一步：模型预测了100个可能的开头，束搜索挑了概率最高的2个（比如“我”和“你”），把剩下的98个扔掉。
第二步：
- 基于“我”，预测后面可能接什么（比如“爱”、“恨”）。
- 基于“你”，预测后面可能接什么（比如“是”、“去”）。
- 这时候，我们手里有了4条路：“我爱”、“我恨”、“你是”、“你去”。
- 关键动作：束搜索再次比较这4条路，只留下总分最高的2条。假设是“我爱”和“你去”。
循环：就这样，每一步都扩展出新的可能，然后无情地砍掉低分的路径，只保留最顶尖的 $k$ 条路一直走下去。