123,123

當(dāng)前位置：首頁(yè) > 范文|應(yīng)用文 > IT技術(shù)專欄 > 網(wǎng)絡(luò)編程

Python中使用hashlib模塊處理算法的教程

來(lái)源：易賢網(wǎng) 閱讀：1373 次日期：2015-04-30 14:40:42

溫馨提示：易賢網(wǎng)小編為您整理了“Python中使用hashlib模塊處理算法的教程”,方便廣大網(wǎng)友查閱！

這篇文章主要介紹了Python中使用hashlib模塊處理算法的教程,代碼基于Python2.x版本,需要的朋友可以參考下

Python的hashlib提供了常見(jiàn)的摘要算法，如MD5，SHA1等等。

什么是摘要算法呢?摘要算法又稱哈希算法、散列算法。它通過(guò)一個(gè)函數(shù)，把任意長(zhǎng)度的數(shù)據(jù)轉(zhuǎn)換為一個(gè)長(zhǎng)度固定的數(shù)據(jù)串(通常用16進(jìn)制的字符串表示)。

舉個(gè)例子，你寫了一篇文章，內(nèi)容是一個(gè)字符串'how to use python hashlib - by Michael'，并附上這篇文章的摘要是'2d73d4f15c0db7f5ecb321b6a65e5d6d'。如果有人篡改了你的文章，并發(fā)表為'how to use python hashlib - by Bob'，你可以一下子指出Bob篡改了你的文章，因?yàn)楦鶕?jù)'how to use python hashlib - by Bob'計(jì)算出的摘要不同于原始文章的摘要。

可見(jiàn)，摘要算法就是通過(guò)摘要函數(shù)f()對(duì)任意長(zhǎng)度的數(shù)據(jù)data計(jì)算出固定長(zhǎng)度的摘要digest，目的是為了發(fā)現(xiàn)原始數(shù)據(jù)是否被人篡改過(guò)。

摘要算法之所以能指出數(shù)據(jù)是否被篡改過(guò)，就是因?yàn)檎瘮?shù)是一個(gè)單向函數(shù)，計(jì)算f(data)很容易，但通過(guò)digest反推data卻非常困難。而且，對(duì)原始數(shù)據(jù)做一個(gè)bit的修改，都會(huì)導(dǎo)致計(jì)算出的摘要完全不同。

我們以常見(jiàn)的摘要算法MD5為例，計(jì)算出一個(gè)字符串的MD5值：

import hashlib

md5 = hashlib.md5()

md5.update('how to use md5 in python hashlib?')

print md5.hexdigest()

計(jì)算結(jié)果如下：

d26a53750bc40b38b65a520292f69306

如果數(shù)據(jù)量很大，可以分塊多次調(diào)用update()，最后計(jì)算的結(jié)果是一樣的：

md5 = hashlib.md5()

md5.update('how to use md5 in ')

md5.update('python hashlib?')

print md5.hexdigest()

試試改動(dòng)一個(gè)字母，看看計(jì)算的結(jié)果是否完全不同。

MD5是最常見(jiàn)的摘要算法，速度很快，生成結(jié)果是固定的128 bit字節(jié)，通常用一個(gè)32位的16進(jìn)制字符串表示。

另一種常見(jiàn)的摘要算法是SHA1，調(diào)用SHA1和調(diào)用MD5完全類似：

import hashlib

sha1 = hashlib.sha1()

sha1.update('how to use sha1 in ')

sha1.update('python hashlib?')

print sha1.hexdigest()

SHA1的結(jié)果是160 bit字節(jié)，通常用一個(gè)40位的16進(jìn)制字符串表示。

比SHA1更安全的算法是SHA256和SHA512，不過(guò)越安全的算法越慢，而且摘要長(zhǎng)度更長(zhǎng)。

有沒(méi)有可能兩個(gè)不同的數(shù)據(jù)通過(guò)某個(gè)摘要算法得到了相同的摘要?完全有可能，因?yàn)槿魏握惴ǘ际前褵o(wú)限多的數(shù)據(jù)集合映射到一個(gè)有限的集合中。這種情況稱為碰撞，比如Bob試圖根據(jù)你的摘要反推出一篇文章'how to learn hashlib in python - by Bob'，并且這篇文章的摘要恰好和你的文章完全一致，這種情況也并非不可能出現(xiàn)，但是非常非常困難。

摘要算法應(yīng)用

摘要算法能應(yīng)用到什么地方?舉個(gè)常用例子：

任何允許用戶登錄的網(wǎng)站都會(huì)存儲(chǔ)用戶登錄的用戶名和口令。如何存儲(chǔ)用戶名和口令呢?方法是存到數(shù)據(jù)庫(kù)表中：

name | password

--------+----------

michael | 123456

bob | abc999

alice | alice2008

如果以明文保存用戶口令，如果數(shù)據(jù)庫(kù)泄露，所有用戶的口令就落入黑客的手里。此外，網(wǎng)站運(yùn)維人員是可以訪問(wèn)數(shù)據(jù)庫(kù)的，也就是能獲取到所有用戶的口令。

正確的保存口令的方式是不存儲(chǔ)用戶的明文口令，而是存儲(chǔ)用戶口令的摘要，比如MD5：

username | password

---------+---------------------------------

michael | e10adc3949ba59abbe56e057f20f883e

bob | 878ef96e86145580c38c87f0410ad153

alice | 99b1c2188db85afee403b1536010c2c9

當(dāng)用戶登錄時(shí)，首先計(jì)算用戶輸入的明文口令的MD5，然后和數(shù)據(jù)庫(kù)存儲(chǔ)的MD5對(duì)比，如果一致，說(shuō)明口令輸入正確，如果不一致，口令肯定錯(cuò)誤。

練習(xí)：根據(jù)用戶輸入的口令，計(jì)算出存儲(chǔ)在數(shù)據(jù)庫(kù)中的MD5口令：

def calc_md5(password):

pass

存儲(chǔ)MD5的好處是即使運(yùn)維人員能訪問(wèn)數(shù)據(jù)庫(kù)，也無(wú)法獲知用戶的明文口令。

練習(xí)：設(shè)計(jì)一個(gè)驗(yàn)證用戶登錄的函數(shù)，根據(jù)用戶輸入的口令是否正確，返回True或False：

db = {

'michael': 'e10adc3949ba59abbe56e057f20f883e',

'bob': '878ef96e86145580c38c87f0410ad153',

'alice': '99b1c2188db85afee403b1536010c2c9'

}

def login(user, password):

pass

采用MD5存儲(chǔ)口令是否就一定安全呢?也不一定。假設(shè)你是一個(gè)黑客，已經(jīng)拿到了存儲(chǔ)MD5口令的數(shù)據(jù)庫(kù)，如何通過(guò)MD5反推用戶的明文口令呢?暴力破解費(fèi)事費(fèi)力，真正的黑客不會(huì)這么干。

考慮這么個(gè)情況，很多用戶喜歡用123456，888888，password這些簡(jiǎn)單的口令，于是，黑客可以事先計(jì)算出這些常用口令的MD5值，得到一個(gè)反推表：

'e10adc3949ba59abbe56e057f20f883e': '123456'

'21218cca77804d2ba1922c33e0151105': '888888'

'5f4dcc3b5aa765d61d8327deb882cf99': 'password'

這樣，無(wú)需破解，只需要對(duì)比數(shù)據(jù)庫(kù)的MD5，黑客就獲得了使用常用口令的用戶賬號(hào)。

對(duì)于用戶來(lái)講，當(dāng)然不要使用過(guò)于簡(jiǎn)單的口令。但是，我們能否在程序設(shè)計(jì)上對(duì)簡(jiǎn)單口令加強(qiáng)保護(hù)呢?

由于常用口令的MD5值很容易被計(jì)算出來(lái)，所以，要確保存儲(chǔ)的用戶口令不是那些已經(jīng)被計(jì)算出來(lái)的常用口令的MD5，這一方法通過(guò)對(duì)原始口令加一個(gè)復(fù)雜字符串來(lái)實(shí)現(xiàn)，俗稱“加鹽”：

def calc_md5(password):

return get_md5(password + 'the-Salt')

經(jīng)過(guò)Salt處理的MD5口令，只要Salt不被黑客知道，即使用戶輸入簡(jiǎn)單口令，也很難通過(guò)MD5反推明文口令。

但是如果有兩個(gè)用戶都使用了相同的簡(jiǎn)單口令比如123456，在數(shù)據(jù)庫(kù)中，將存儲(chǔ)兩條相同的MD5值，這說(shuō)明這兩個(gè)用戶的口令是一樣的。有沒(méi)有辦法讓使用相同口令的用戶存儲(chǔ)不同的MD5呢?

如果假定用戶無(wú)法修改登錄名，就可以通過(guò)把登錄名作為Salt的一部分來(lái)計(jì)算MD5，從而實(shí)現(xiàn)相同口令的用戶也存儲(chǔ)不同的MD5。

練習(xí)：根據(jù)用戶輸入的登錄名和口令模擬用戶注冊(cè)，計(jì)算更安全的MD5：

db = {}

def register(username, password):

db[username] = get_md5(password + username + 'the-Salt')

然后，根據(jù)修改后的MD5算法實(shí)現(xiàn)用戶登錄的驗(yàn)證：

def login(username, password):

pass

小結(jié)

摘要算法在很多地方都有廣泛的應(yīng)用。要注意摘要算法不是加密算法，不能用于加密(因?yàn)闊o(wú)法通過(guò)摘要反推明文)，只能用于防篡改，但是它的單向計(jì)算特性決定了可以在不存儲(chǔ)明文口令的情況下驗(yàn)證用戶口令。

更多信息請(qǐng)查看IT技術(shù)專欄

更多信息請(qǐng)查看網(wǎng)絡(luò)編程

上一篇：使用Python的內(nèi)建模塊collections的教程

下一篇：在Python中使用元類的教程

易賢網(wǎng)手機(jī)網(wǎng)站地址：Python中使用hashlib模塊處理算法的教程

由于各方面情況的不斷調(diào)整與變化，易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考，敬請(qǐng)考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)！

相關(guān)閱讀網(wǎng)絡(luò)編程

Shell中如何刪除文本比較長(zhǎng)的行的實(shí)現(xiàn)方法10月30日

vue.js語(yǔ)法及常用指令10月30日

python 讀寫中文json的實(shí)例詳解10月30日

Objective-C Json 實(shí)例詳解10月30日

bootstrap table sum總數(shù)量統(tǒng)計(jì)實(shí)現(xiàn)方法10月30日

python生成二維碼的實(shí)例詳解10月30日

Python批量更改文件名的實(shí)現(xiàn)方法10月30日

解決出現(xiàn)Incorrect integer value的問(wèn)題10月30日

jQuery實(shí)現(xiàn)切換隱藏與顯示同時(shí)切換圖標(biāo)功能10月30日

docker python api 安裝配置的詳解10月30日

javascript按鈕禁用和啟用的效果實(shí)例代碼10月30日

vue.js todolist實(shí)現(xiàn)代碼10月30日

vue.js 父向子組件傳參的實(shí)例代碼10月30日

apache 開(kāi)啟重定向 rewrite的實(shí)現(xiàn)方法10月30日

Vue.js劃分組件的方法10月30日

python logging日志模塊的詳解10月30日

vue中的scope使用詳解10月30日

docker cgroup 資源監(jiān)控的詳解10月30日

使用Android Studio 開(kāi)發(fā)自己的SDK教程10月23日

linux系統(tǒng)下MongoDB單節(jié)點(diǎn)安裝教程10月23日

易賢網(wǎng)移動(dòng)網(wǎng)站