我们在网上下载软件的时候,上面经常会附加一个 MD5 值。那么这个 MD5 是什么呢?又起到什么作用呢?
一起跟我来看看吧。
全称为 消息摘要算法版本5 (Message Digest Algorithm 5)
它是一种 Hash 算法。
作用是为了信息安全。
再具体点,MD5 值就是一串 128 bit 的数据。
MD5 的核心是通过算法把任意长度的原始数据映射成128 bit 的数据。这一点跟CRC 类似,都是把一串数据经过处理,得到另一个固定长度的数据。(所以讲完 CRC,我要讲 MD5, 因为它们两个在实际中经常会出现和用到。)
MD5 的特点:
不可逆性 --- 根据 MD5 值计算不出原始数据
唯一性 --- 不同原始数据会有不同的 MD5 值 (不完全可靠,后面说)
MD5 到底算不算加密算法?仁者见仁智者见智吧。说它是加密,因为它确实把原始数据,比如用户密码,变成了一般人看不懂的 MD5 值;说它不是加密,因为它不能解密。
据说 Linux 系统中,用户密码,都是以 MD5 形式存在文件中的,这样你在输入密码的时候,计算机只要计算你输入密码的 MD5 再跟计算机文件中存储的 MD5 进行比对就行了。
第一步:数据填充。填充后数据长度为 512 bit 的整数倍。
第二步: 循环计算。每 512 bit 作为一组,前一个分组得到的 MD5 作为下一个 分组的状态输入 (看作就是ABCD 吧,代表 4 个 32 bit)。最终的ABCD 就是128 bit 的 MD5。
具体的计算过程比较复杂,这里不细说了,说多了大家看起来比较吃力。上面两幅图已经说明了大体的流程。
Hash 碰撞是指两份不同的原始数据,得到相同的 MD5 值。
我前面已经提到,MD5 是具有唯一性的,其实---这个唯一性是有限的,有概率的。
MD5 之所以应用这么广泛,就是因为它的可靠性,很难有两个不同的输入,得到相同的 MD5。但是!!!虽然概率低 (具体有多大概率,我还没研究清楚),但是确实有。
2004 年山东大学的王晓云就破解了 MD5, 找到了 Hash 碰撞。
其实,Hash 碰撞还是小概率事件了,要不然为何如今尽管已经有人破解了 MD5, 但它还是被大家屁颠屁颠的用着呢?
网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。
加入交流群
请使用微信扫一扫!