似然与概率傻傻分不清楚?

4,219次阅读
没有评论

共计 1511 个字符,预计需要花费 4 分钟才能阅读完成。

似然与概率:傻傻分不清?统计和机器学习模型中的最大似然估计到底是什么?
一句话区分
概率是:已知模型,求统计结果的可能性有多大似然是:已知结果,反推哪个模型,或者说一个模型的什么参数更可能产生它

从一个掷骰子的例子开始
假设我们有一个六面骰子,我们要研究它的行为。
场景一:已知骰子是公平的,问掷出“6”的概率是多少?→ 这是概率问题。

→ 模型已知:公平骰子(每个点数的概率是 1/6)

→ 事件:掷出一个“6”

→ 概率:P(掷出6) = 1/6

场景二:你掷了 10 次骰子,结果是:6 出现了 5 次。你开始怀疑这个骰子是不是“偏的”。你想比较两个假设:

H1:骰子是公平的;H2:骰子偏向 6(掷出6的概率是0.5)

→ 模型未知,数据已知:现在我们想知道哪个模型更可能“产生”这组结果。

→ 这是似然问题。

相同表达式,不同角色
在数学上我们经常看到这样的表达式:P(data | θ)但含义根据已知和要求不同而不同:

– 如果已知 θ,求 data 的概率 ⇒ 这是概率

– 如果已知 data,比较不同 θ 哪个更可能 ⇒ 这是似然

在统计推断中的角色
概率的作用:构建模型、预测未来事件、衡量不确定性似然的作用:参数估计(如最大似然估计MLE)、构建贝叶斯后验分布

一个简单类比:倒推 vs 正推
你看到路上有水坑,想知道是“下雨”还是“洒水”。→ 如果你知道下雨概率70%,可以预测将看到水坑 ⇒ 概率

→ 如果你已经看到了水坑,想推断是下雨还是洒水 ⇒ 似然

总结一下概率 (Probability): 面向数据,用于预测事件,是正向推理(模型 ➝ 数据)

似然 (Likelihood): 面向模型,用于估计参数,是反向推理(数据 ➝ 模型)

最大似然估计:从数据中“倒推”世界的方式
一句话定义最大似然估计就是:

在所有可能的参数中,找到最有可能生成你观察到的数据的那一组。

用掷硬币举个简单例子

你怀疑一枚硬币可能不是公平的,于是你连续抛了10次,结果是:

正面:7 次,反面:3 次

你现在的问题是:这个硬币正面朝上的概率 p 是多少?

方法一:拍脑袋猜?

也许你想说,7/10 = 0.7,那 p=0.7 吧?

这其实就是最大似然估计给你的答案!

最大似然的数学想法

MLE 会问一个问题:

“如果硬币正面朝上的概率是某个值 p,那么看到 7 次正面、3 次反面的可能性有多大?”

这个可能性叫做“似然(Likelihood)”,我们可以写成:

L(p) = P(看到这个数据 | p) = C(10, 7) * p^7 * (1-p)^3

你会发现,这个式子在 p = 0.7 时取得最大值。也就是说:在所有可能的 p 值中,p = 0.7 最有可能生成我们观察到的结果。

图像理解:谁的“解释力”最强?

我们可以把似然函数画出来:横轴是不同的 p 值,纵轴是“看到这组数据”的可能性。

你会发现图像在 p = 0.7 处达到峰值。这一点,就是最大似然估计给出的答案。

见下图:

似然与概率傻傻分不清楚?
图示:似然函数在 p=0.7 处达到最大值
类比一下更好懂
想象你是侦探,现在案发现场有一组证据(数据)。你面前有几位嫌疑人(不同的参数)。你想问:“哪位嫌疑人最可能制造了这些证据?”

最大似然估计 的作用就是:找出那个“最符合现场数据”的嫌疑人。

应用场景有哪些?最大似然估计几乎在所有现代统计和机器学习模型中都被使用:

– 逻辑回归 / 线性回归

– 高斯混合模型

– 隐马尔可夫模型(HMM)

– 深度学习中的交叉熵损失

和贝叶斯方法的区别?

MLE 是只关心“哪个参数最有可能解释数据”,它不考虑先验知识。

而贝叶斯方法会说:

“我有点先验知识,再结合你给我的数据,一起算出‘后验’。”

方法比较:

– 最大似然 MLE:不考虑先验,输出最可能的参数点估计

– 贝叶斯估计:考虑先验,输出参数的概率分布(后验)

总结一句话最大似然估计是一种强大而优雅的工具,它帮助我们从“已知的数据”中,反推最可能的“生成机制”。

正文完
 0
评论(没有评论)

汽车质量管理笔记

文章搜索
猜您喜欢
MSA量测系统分析中关于NDC与GRR的理解

MSA量测系统分析中关于NDC与GRR的理解

NDC Number of Distinct Categories,是指测量得到数据分组的数量值大小的代码。您...
总布置设计参考

总布置设计参考

文章来源:网络
防呆防错十大原理及案例应用介绍

防呆防错十大原理及案例应用介绍

防呆法 其义即是防止呆笨的人做错事。亦即,连愚笨的人也不会做错事的设计方法,故又称为愚巧法。 十大原理 1、断...
提升员工质量意识培训ppt

提升员工质量意识培训ppt

产品质量的重要性 在我们的日常生活中,质量无处不在。试想一下,如果战场上士兵使用的枪械出现故障,如果跳伞时降落...
淬火裂纹的分类_淬火裂纹的特征

淬火裂纹的分类_淬火裂纹的特征

 淬火裂纹类型 淬火裂纹一般来讲通常分为纵向裂纹、横向裂纹、网状裂纹、剥离裂纹四种。 1、纵向裂纹(又称轴向裂...
即刻尝鲜
管理者最厉害的绝招:反问

管理者最厉害的绝招:反问

管理工具中的“反问”,不仅是一种沟通技巧,更是一种强大的领导力催化剂。它的核心应用场景是将“管理者驱动”转变为...
走上管理岗,管理者一定要有的7个SOP思维

走上管理岗,管理者一定要有的7个SOP思维

1、汇报工作的SOP——SCAQ模型 2、目标设定的SOP——SMART模型 3、思路清晰的SOP——5W2H...
空气悬架高度传感器靠谱吗?

空气悬架高度传感器靠谱吗?

高度传感器在电控悬架系统中,用于检测车身与车轮之间的相对高度,为悬架控制系统提供车身高度信息,以便自动调节车身...
麦格纳工装夹具设计培训教材+要点总结

麦格纳工装夹具设计培训教材+要点总结

工装夹具设计一般是在零件的机械加工工艺过程制订之后按照某一工序的具体要求进行的。制订工艺过程,应充分考虑夹具实...
ISO9001-2026与ISO 9001-2015标准对照表

ISO9001-2026与ISO 9001-2015标准对照表

把新版和 2015 版做了一份对照表,哪些条款变了,哪些只是重新组织结构,哪些地方是真正收紧、以后要重点关注的...
最新评论
大师兄 大师兄 独立事件和卡方检验,都是非常重要的质量管理概念,挺难理解的。
透彻理解卡方检验 - 汽车质量管理笔记 透彻理解卡方检验 - 汽车质量管理笔记 […] 化简后的式子是我们在卡方检验中需要用到的式子,所以请大家牢记!对于上述式子有疑惑的读者可以学习基础的概率论,也可以参考我之前写的一篇关于独立的文章(《【直观数学】如何理解两事件间的独立关系》)。如果没有问题的话,我们可以进入到卡方检验原理与步骤的主体介绍部分! […]
infinite cui infinite cui 需求VDA6.3 表格,谢谢
大师兄 大师兄 说的挺有道理的,从现实看到的大部分情况,做技术的人都比较直,对技术的一丝不苟,容易在遇到需要展现管理能力的时候,就会表现出短板来。管理需要授权,更多应该思考团队、部门间,人员发展,对未来的变化做出应对等的能力。
大师兄 大师兄 抱歉,暂无PPT可供下载。
john john 如何获得这个PPT文件
大师兄 大师兄 里面确实有一些叫法和我们平时不一样
大师兄 大师兄 这个案例来自一本教科书,短短一页不到的案例描述,有可能漏掉某些细节。我想马自达的员工不会不知道这点,很可能是案例没有提到。马自达的员工更愿意偏离规范不过是这本教科书的猜测罢了。因为象传输系统这么复杂的产品,做得好与做得不好都可能有多个原因。我从另一个案例分析中发现,马自达的最终产品还是比福特的更满足规范要求。 变更控制是必要的。
PeriMasto PeriMasto 这个写的不错,很实用,谢谢!
生产、质量及技术三个难兄难弟的关系 | 汽车质量人小馆 生产、质量及技术三个难兄难弟的关系 | 汽车质量人小馆 […] 附:《生产质量管理十六字精髓》(点击可查具体讲解) […]