在數(shù)據(jù)庫(kù)中,對(duì)性能影響最大的包括數(shù)據(jù)庫(kù)的鎖策略、緩存策略、索引策略、存儲(chǔ)策略、執(zhí)行計(jì)劃優(yōu)化策略。
索引策略決定數(shù)據(jù)庫(kù)快速定位數(shù)據(jù)的效率,存儲(chǔ)策略決定數(shù)據(jù)持久化的效率。
1.索引不存儲(chǔ)null值。
更準(zhǔn)確的說(shuō),單列索引不存儲(chǔ)null值,復(fù)合索引不存儲(chǔ)全為null的值。索引不能存儲(chǔ)Null,所以對(duì)這列采用is null條件時(shí),因?yàn)樗饕细?/P>
沒(méi)Null值,不能利用到索引,只能全表掃描。
為什么索引列不能存Null值?
將索引列值進(jìn)行建樹(shù),其中必然涉及到諸多的比較操作。Null值的特殊性就在于參與的運(yùn)算大多取值為null。這樣的話,null值實(shí)際上是不能
參與進(jìn)建索引的過(guò)程。也就是說(shuō),null值不會(huì)像其他取值一樣出現(xiàn)在索引樹(shù)的葉子節(jié)點(diǎn)上。
2.不適合鍵值較少的列(重復(fù)數(shù)據(jù)較多的列)。
假如索引列TYPE有5個(gè)鍵值,如果有1萬(wàn)條數(shù)據(jù),那么 WHERE TYPE = 1將訪問(wèn)表中的2000個(gè)數(shù)據(jù)塊。
再加上訪問(wèn)索引塊,一共要訪問(wèn)大于200個(gè)的數(shù)據(jù)塊。
如果全表掃描,假設(shè)10條數(shù)據(jù)一個(gè)數(shù)據(jù)塊,那么只需訪問(wèn)1000個(gè)數(shù)據(jù)塊,既然全表掃描訪問(wèn)的數(shù)據(jù)塊
少一些,肯定就不會(huì)利用索引了。
3.前導(dǎo)模糊查詢不能利用索引(like '%XX'或者like '%XX%')
假如有這樣一列code的值為'AAA','AAB','BAA','BAB' ,如果where code like '%AB'條件,由于前面是
模糊的,所以不能利用索引的順序,必須一個(gè)個(gè)去找,看是否滿足條件。這樣會(huì)導(dǎo)致全索引掃描或者全表掃
描。如果是這樣的條件where code like 'A % ',就可以查找CODE中A開(kāi)頭的CODE的位置,當(dāng)碰到B開(kāi)頭的
數(shù)據(jù)時(shí),就可以停止查找了,因?yàn)楹竺娴臄?shù)據(jù)一定不滿足要求。這樣就可以利用索引了。
4.MySQL主要提供2種方式的索引:B-Tree索引,Hash索引。
B樹(shù)索引具有范圍查找和前綴查找的能力,對(duì)于有N節(jié)點(diǎn)的B樹(shù),檢索一條記錄的復(fù)雜度為O(LogN)。相當(dāng)于二分查找。
哈希索引只能做等于查找,但是無(wú)論多大的Hash表,查找復(fù)雜度都是O(1)。
顯然,如果值的差異性大,并且以等值查找(=、 <、>、in)為主,Hash索引是更高效的選擇,它有O(1)的查找復(fù)雜度。
如果值的差異性相對(duì)較差,并且以范圍查找為主,B樹(shù)是更好的選擇,它支持范圍查找。
MySQL中兩大主要存儲(chǔ)引擎MyISAM和InnoDB采用了不同的索引和存儲(chǔ)策略,本文將分析它們的異同和性能。
更多信息請(qǐng)查看IT技術(shù)專欄