翟晓鹰 作品

第605章 多元分类用softmax函数,用故事解释

用故事解释softmax函数

故事背景:选举村的村长选举

在一个叫“选举村”的地方,每四年一次,村民们都要选出一位新村长。这次,有四位候选人:

? 阿强(擅长务农,村民对他比较熟悉)

? 小美(善于管理,做过村委会秘书)

? 老李(年纪较大,经验丰富,但村民对他评价不一)

? 张三(刚来村子不久,大家对他了解不多)

选举日,村民们需要根据他们的支持度,选择一个人投票。但村民的支持度并不是“非黑即白”的,每个人对每位候选人的好感度都不同。为了更公平地衡量大家的意愿,村子里的智者发明了一种方法,叫 softmax 规则。

softmax 的运作方式

智者让每个村民给四位候选人打分,比如某个村民的打分是:

? 阿强:8分

? 小美:6分

? 老李:5分

? 张三:3分

但是,这些分数只是相对的,我们需要转换成“概率”来反映这个村民的最终选择倾向。softmax 规则的做法是:

1. 先用指数函数(e的指数)放大分数,避免负分影响决策:

2. 计算这些指数值的总和:

3. 再计算每个候选人的支持度占比:

这样,每个人最终的选择概率就会落在 到 之间,并且所有候选人的概率加起来是 (保证了最终一定会选出一位村长)。

比喻解释:冰淇淋店的选择

假设你走进了一家冰淇淋店,店里有四种口味:

? 巧克力(你最爱)

? 香草(你觉得还行)

? 草莓(一般般)

? 抹茶(你不太喜欢)

如果你只是随意选,你可能会纠结,但softmax 规则就像是在你的大脑里装了一个“选择助理”,它根据你对每个口味的喜爱程度(打分),帮你转换成最终的选择概率。例如:

? 你对巧克力的喜爱度是9分,香草7分,草莓5分,抹茶2分。

? softmax 把这些分数转化成指数值,然后归一化成概率:

结果就是,你有最高的概率选择巧克力,较低的概率选择香草,几乎不会选抹茶。

总结

softmax 函数的本质是:

1. 将原始分数(打分)转换成概率,使得总和为 1。

2. 指数放大优势,让分数高的选项更有可能被选中。

3. 让所有选项都有可能被选中(即使得分最低的选项概率也不会完全是0)。

无论是在选举、推荐系统还是Ai分类任务中,softmax 都像一个“理性的选择助手”,帮我们做出合理的决策。

多层分类的中间层会有偏置和中间结果

用故事解释“偏置”和“中间结果”

故事背景:魔法师的学徒

在一个魔法学院里,有一位年轻的学徒——小艾。他正在学习如何用魔法配制“完美药水”。

学院的导师告诉他:“要配出理想的药水,你需要三个关键步骤:”

1. 收集原料(输入数据)

2. 研磨并混合(计算中间结果)

3. 调整口味(加上偏置)

小艾开始尝试:

? 他拿了 龙眼果(原料1),月光花(原料2),银露水(原料3),这些原料各自有不同的药效分数。

? 他按照导师给的魔法公式进行计算,把这些原料的效果 加权(类似于机器学习中的“权重”)得到一个中间结果。

? 但是,每次配出来的药水,总觉得有点偏酸或者偏苦,于是导师告诉他:“要加上一点魔法糖!”

这 魔法糖 就是 偏置(bias)!

导师解释道:“有时候,光靠原料混合出来的效果可能会偏离目标,比如太苦了,我们就需要手动加点甜味,这样最终的药水才是完美的。”

小艾恍然大悟,他在最后的配方中加入了一点 魔法糖(偏置),最终成功调配出一款 恰到好处的药水(输出结果)。

用比喻解释“偏置”和“中间结果”

比喻1:做菜

想象你正在做一锅汤,你的过程是这样的:

1. 你放了鸡肉、蔬菜和调料(输入数据)。

2. 你用锅把这些食材煮成高汤(计算中间结果)。

3. 但你尝了一口,觉得味道有点淡,于是加了一点盐(偏置)。

这最后加的盐就是“偏置”,它的作用是让最终的味道更符合你的期待,而不是完全取决于原料本身的味道。

比喻2:考试成绩调整

假设一群学生参加了数学考试,老师发现:

? 有些学生因为压力太大,考试成绩偏低。

? 有些题目出得特别难,导致整体分数偏低。

为了更公平地评估学生的能力,老师在所有人的成绩上额外加了5分。

这个“额外加的5分”就是 偏置(bias)!它的作用是:

? 让整个评分系统更加合理。

? 弥补一些系统性误差,比如有的考试本身比别的考试更难。

而学生的原始分数就是 中间结果,它是由他们答题的情况决定的,但最终的成绩还要经过调整(加偏置)才能成为最终分数。

总结

? 中间结果 就是计算过程中的“半成品”,就像汤还没加盐,药水还没加糖,考试还没加调分。

? 偏置(bias) 就是最后人为加上的“调整项”,它的作用是让最终结果更合理、更符合目标。

就像魔法师加糖、厨师加盐、老师调分一样,神经网络在计算时也会用“偏置”来微调输出结果,使它更加精准。