ML与Information:机器学习与Information信息论之间那些七七八八、乱七八糟、剪不断理还乱的关系攻略
目录
更新……
(1)、相对熵:两个KL散度的区别:
1)、绿色曲线是真实分布p的等高线;红色曲线是使用近似p(z1,z2)=p(z1)p(z2)得到的等高线。
2)、蓝色曲线是真实分布p的等高线;红色曲线是单模型近似分布q的等高线。
(2)各种熵之间的关系图
(1)、两点分布的熵
(2)、三点分布的熵
Logistic/Softmax回归的后验概率
最大熵模型的后验概率
《A Brief MaxEnt Tutorial》 Adam Berger
《A simple Introduction to Maximum Entropy Models for Natural Language Processing》Adwait Ratnaparkhi
《Learning to parse natural language with maximum entropy models》 Adwait Ratnaparkhi
《统计学习方法》李航,清华大学出版社,2012年
《Elements of Information Theory》 Cover & Thomas
《A maximum entropy approach to natural language processing 》Adam Berger
网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。
加入交流群
请使用微信扫一扫!