10-29 03:17 阅读 102

机器学习基础知识—KL 散度

今天将探讨一种比较两个概率分布的方法，称为 Kullback-Leibler 散度(通常简称为KL散度)。我们先给出公式

$DKL(P∣∣Q)=∑iP(i)log⁡P(i)Q(i)DKL(P∣∣Q)=∫P(x)log⁡P(x)Q(x)dxD_{KL}(P||Q) = \sum_i P(i) \log \frac{P(i)}{Q(i)}\\ D_{KL}(P||Q) = \int P(x) \log \frac{P(x)}{Q(x)} dx\\$

上面公式是看 $Q (i)$ 与目标 $P (i)$ 概率的差距。对于KL散度具有非对称性和非负性。

对于投硬币的问题我们假设我们观察到的是在投掷了 N 次中，正面朝上的次数为 $N_H$ ，而背面朝上的次数为 $N_T$ 。假设有两个概率分布分别为 P (real coin)和 Q，其中 P 概率分布表示为 $p_1,p_2$ 这两概率表示在 P 概率分布中正面朝上的概率为 $p_1$ 而背面朝上的概率为 $p_2$ 。而预测概率分布为 Q(coin1),其中分布中正面朝上的概率为 $q_1$ 而背面朝上的概率为 $q_2$

$P(Observations|real\,coin) = p_1^{N_H}p_2^{N_T}\\ P(Observations|coin1 ) = q_1^{N_H}q_2^{N_T}\\$

分别用概率分布 P 和概率分布 Q 前提，看到 N 次中，正面朝上的次数为 $N_H$ ，而背面朝上的次数为 $N_T$ 观察值，也就是似然。

$log⁡(p1NHp2NTq1NHq2NT)1N\log(\frac{p_1^{N_H}p_2^{N_T}}{q_1^{N_H}q_2^{N_T}})^{\frac{1}{N}}$

上面对其比值进行正则化，也就是取 $1N\frac{1}{N}$ 后取 log

$NHNlog⁡p1+NTNlog⁡p2−NHNlog⁡q1−NTNlog⁡q2q1log⁡p1+q1log⁡p2−q1log⁡p1−q2log⁡p2q1q1log⁡p1q1+q2log⁡p2q2=∑iqipiqi\frac{N_H}{N} \log p_1 + \frac{N_T}{N} \log p_2 - \frac{N_H}{N} \log q_1 -\frac{N_T}{N} \log q_2\\ q_1 \log p_1 + q_1 \log p_2 - q_1 \log p_1 - q_2 \log p_2\\ q_1\\ q_1 \log \frac{p_1}{q_1} + q_2 \log \frac{p_2}{q_2}\\ =\sum_i q_i \frac{p_i}{q_i}$

这就是整个推导过程。

作者：zidea
链接：https://juejin.cn/post/7024072585063170055

推荐资源

人物调色/风景/修图等PS技巧混合视频教程第2期抖品牌·三天引爆流量训练营，实现生意总量滚雪球增长推荐系统架构设计项目课程大数据精华应用实战课程-大型电商推荐系统项目实战知乎截流引爆全网流量，教你如何在知乎中最有效率，最低成本的引流【视频课程】黑马javaEE 2020年会员版2.1就业课程240G带文档资料源码打造高可用的Linux Virtual Server-LVS详解企业级负载均衡解决方案 LVS原理详解财务报表分析案例-5分钟快速读懂财务报表 MCSE 2012 R2教学视频 47讲MCSE 2012视频教程带你领略微软技术 java web轻量级小巧视频网站系统项目源码 java源码动态网页设计与制作–CSS+JavaScript[吴以欣陈小宁]