MySQL數(shù)據(jù)庫快問快答
- 來源:縱橫數(shù)據(jù)
- 作者:中橫科技
- 時間:2022/8/18 16:51:29
- 類別:新聞資訊
1. UNION ALL 與 UNION 的區(qū)別
UNION和UNION ALL關(guān)鍵字都是將兩個結(jié)果集合并為一個。
UNION在進行表鏈接后會篩選掉重復的記錄,所以在表鏈接后會對所產(chǎn)生的結(jié)果集進行排序運算,刪除重復的記錄再返回結(jié)果。
而UNION ALL只是簡單的將兩個結(jié)果合并后就返回。
由于UNION需要排序去重,所以 UNION ALL 的效率比 UNION 好很多。
2. TRUNCATE 與 DELETE 區(qū)別
TRUNCATE 是DDL語句,而 DELETE 是DML語句。
TRUNCATE 是先把整張表drop調(diào),然后重建該表。而 DELETE 是一行一行的刪除,所以 TRUNCATE 的速度肯定比 DELETE 速度快。
TRUNCATE 不可以回滾,DELETE 可以。
TRUNCATE 執(zhí)行結(jié)果只是返回0 rows affected,可以解釋為沒有返回結(jié)果。
TRUNCATE 會重置水平線(自增長列起始位),DELETE 不會。
TRUNCATE 只能清理整張表,DELETE 可以按照條件刪除。
一般情景下,TRUNCATE性能比DELETE好一點。
3. TIMESTAMP 與 DATETIME 的區(qū)別
相同點
TIMESTAMP 列的顯示格式與 DATETIME 列相同。顯示列寬固定在19字符,并且格式為YYYY-MM-DD HH:MM:SS。
不同點
TIMESTAMP
4個字節(jié)存儲,時間范圍:1970-01-01 08:00:01~2038-01-19 11:14:07。
值以UTC格式保存,涉及時區(qū)轉(zhuǎn)化,存儲時對當前的時區(qū)進行轉(zhuǎn)換,檢索時再轉(zhuǎn)換回當前的時區(qū)。
DATETIME
8個字節(jié)存儲,時間范圍:1000-10-01 00:00:00~9999-12-31 23:59:59。
實際格式存儲,與時區(qū)無關(guān)。
4. 什么是聯(lián)合索引
兩個或更多個列上的索引被稱作聯(lián)合索引,聯(lián)合索引又叫復合索引。
5. 為什么要使用聯(lián)合索引
減少開銷:建一個聯(lián)合索引(col1,col2,col3),實際相當于建了(col1),(col1,col2),(col1,col2,col3)三個索引。減少磁盤空間的開銷。
覆蓋索引:對聯(lián)合索引(col1,col2,col3),如果有如下的sql: select col1,col2,col3 from test where col1=1 and col2=2。那么MySQL可以直接通過遍歷索引取得數(shù)據(jù),而無需回表,這減少了很多的隨機io操作。覆蓋索引是主要的提升性能的優(yōu)化手段之一。
效率高:索引列越多,通過索引篩選出的數(shù)據(jù)越少。有1000W條數(shù)據(jù)的表,有如下sql
select from table where col1=1 and col2=2 and col3=3
,假設(shè)假設(shè)每個條件可以篩選出10%的數(shù)據(jù),如果只有單值索引,那么通過該索引能篩選出1000W * 10%=100w
條數(shù)據(jù),然后再回表從100w條數(shù)據(jù)中找到符合col2=2 and col3= 3
的數(shù)據(jù),然后再排序,再分頁;如果是聯(lián)合索引,通過索引篩選出1000w * 10% * 10% * 10%=1w
,效率得到明顯提升。
6. MySQL 聯(lián)合索引最左匹配原則
在 MySQL 建立聯(lián)合索引時會遵循最左前綴匹配的原則,即最左優(yōu)先,在檢索數(shù)據(jù)時從聯(lián)合索引的最左邊開始匹配。
MySQL 會一直向右匹配直到遇到范圍查詢(>、<、between、like)就停止匹配,比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)順序的索引,d是用不到索引的,如果建立(a,b,d,c)的索引則都可以用到,a,b,d的順序可以任意調(diào)整。
= 和 in 可以亂序,比如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意順序,mysql的查詢優(yōu)化器會幫你優(yōu)化成索引可以識別的形式。
7. 什么是聚集和非聚集索引
聚集索引就是以主鍵創(chuàng)建的索引。
非聚集索引就是以非主鍵創(chuàng)建的索引。
8. 什么是覆蓋索引
覆蓋索引(covering index)指一個查詢語句的執(zhí)行只用從索引頁中就能夠取得(如果不是聚集索引,葉子節(jié)點存儲的是主鍵+列值,最終還是要回表,也就是要通過主鍵再查找一次),避免了查到索引后,再做回表操作,減少I/O提高效率。
可以結(jié)合第10個問題更容易理解。
9. 什么是前綴索引
前綴索引就是對文本的前幾個字符(具體是幾個字符在創(chuàng)建索引時指定)創(chuàng)建索引,這樣創(chuàng)建起來的索引更小。但是MySQL不能在ORDER BY或GROUP BY中使用前綴索引,也不能把它們用作覆蓋索引。
創(chuàng)建前綴索引的語法:
ALTER TABLE table_name ADD KEY(column_name(prefix_length))
10. InnoDB 與 MyISAM 索引存儲結(jié)構(gòu)的區(qū)別
MyISAM索引文件和數(shù)據(jù)文件是分離的,索引文件僅保存數(shù)據(jù)記錄的地址。
而在InnoDB中,表數(shù)據(jù)文件本身就是按B+Tree組織的一個索引結(jié)構(gòu),這棵樹的葉節(jié)點data域保存了完整的數(shù)據(jù)記錄。這個索引的key是數(shù)據(jù)表的主鍵,因此InnoDB表數(shù)據(jù)文件本身就是主索引,所以必須有主鍵,如果沒有顯示定義,自動為生成一個隱含字段作為主鍵,這個字段長度為6個字節(jié),類型為長整型。
InnoDB的輔助索引(Secondary Index,也就是非主鍵索引)存儲的只是主鍵列和索引列,如果主鍵定義的比較大,其他索引也將很大。
MyISAM引擎使用B+Tree作為索引結(jié)構(gòu),索引文件葉節(jié)點的data域存放的是數(shù)據(jù)記錄的地址,指向數(shù)據(jù)文件中對應的值,每個節(jié)點只有該索引列的值。
MyISAM主索引和輔助索引(Secondary key)在結(jié)構(gòu)上沒有任何區(qū)別,只是主索引要求key是唯一的,輔助索引可以重復,(由于MyISAM輔助索引在葉子節(jié)點上存儲的是數(shù)據(jù)記錄的地址,和主鍵索引一樣,所以不需要再遍歷一次主鍵索引)。
簡單的說:
主索引的區(qū)別:InnoDB的數(shù)據(jù)文件本身就是索引文件。而MyISAM的索引和數(shù)據(jù)是分開的。
輔助索引的區(qū)別:InnoDB的輔助索引data域存儲相應記錄主鍵的值而不是地址。而MyISAM的輔助索引和主索引沒有多大區(qū)別。
11. 為什么盡量選擇單調(diào)遞增數(shù)值類型的主鍵
InnoDB中數(shù)據(jù)記錄本身被存于主索引(B+樹)的葉子節(jié)點上。這就要求同一個葉子節(jié)點內(nèi)(大小為一個內(nèi)存頁或磁盤頁)的各條數(shù)據(jù)記錄按主鍵順序存放,因此每當有一條新的記錄插入時,MySQL會根據(jù)其主鍵將其插入適當?shù)慕Y(jié)點和位置,如果頁面達到裝載因子(InnoDB默認為15/16),則開辟一個新的頁。
如果使用自增主鍵,那么每次插入新的記錄,記錄就會順序添加到當前索引結(jié)點的后續(xù)位置,當一頁寫滿,就會自動開辟一個新的頁,這樣就會形成一個緊湊的索引結(jié)構(gòu),近似順序填滿。由于每次插入時也不需要移動已有數(shù)據(jù),因此效率很高,也不會增加很多開銷在維護索引上。
如果使用非自增主鍵,由于每次插入主鍵的值近似于隨機,因此每次新紀錄都要被插入到現(xiàn)有索引頁的中間某個位置,此時MySQL不得不為了將新記錄查到合適位置而移動元素,甚至目標頁可能已經(jīng)被回寫到磁盤上而從緩存中清掉,此時又要從磁盤上讀回來,這增加了很多開銷,同時頻繁的移動、分頁操作造成了大量的碎片,得到了不夠緊湊的索引結(jié)構(gòu),后續(xù)不得不通過 OPTIMIZE TABLE 來重建表并優(yōu)化填充頁面。
簡單的說:
索引樹只能定位到某一頁,每一頁內(nèi)的插入還是需要通過比較、移動插入的。所以有序主鍵可以提升插入效率。
12. 建表時,int 后面的長度的意義
int占多少個字節(jié),已經(jīng)是固定的了,長度代表了顯示的最大寬度。如果不夠會用0在左邊填充,但必須搭配zerofill使用。也就是說,int的長度并不影響數(shù)據(jù)的存儲精度,長度只和顯示有關(guān)。
13. SHOW INDEX 結(jié)果字段代表什么意思
Table:
表名。
Non_unique:
0:該索引不含重復值。
1:該索引可含有重復值。
Key_name:
索引名稱,如果是注解索引,名稱總是為PRIMARY。
Seq_in_index:
該列在索引中的序號,從 1 開始。例如:存在聯(lián)合索引 idx_a_b_c (a,b,c),則a的Seq_in_index=1,b=2,c=3。
Column_name:
列名。
Collation:
索引的排列順序:A(ascending),D (descending),NULL (not sorted)。
Cardinality:
一個衡量該索引的唯一程度的值,可以使用ANALYZE TABLE(INNODB) 或者 myisamchk -a(MyISAM)更新該值。
如果表記錄太少,該字段的意義不大。一般情況下,該值越大,索引效率越高。
Sub_part:
對于前綴索引,用于索引的字符個數(shù)。如果整個字段都加上了索引,則顯示為NULL。
Null:
YES:該列允許NULL值。
”:該列不允許NULL值。
Index_type:
索引類型,包括(BTREE, FULLTEXT, HASH, RTREE)。
如何解決like’%字符串%’時索引失效?
LIKE問題:like 以通配符開頭 (‘%abc…’),mysql索引失效會變成全表掃描的操作。
罪魁禍首是%,不是LIKE,LIKE 條件是 type = range 級別
%xxx%:全表掃描
%xxx:全表掃描
xxx%:range
解決辦法:
使用覆蓋索引,可以由 ALL 變?yōu)镮NDEX,為啥呢?覆蓋索引之后就能使用使用索引進行全表掃描。這里要注意一下,使用符合索引的時候,命中一個字段就可以,不用全部命中。
15. MySQL高效分頁
存在SQL:SELECT * FROM ttl_product_info ORDER BY id LIMIT N,M。其中 LIMIT N,M 存在的問題最大:取出N+M行,丟棄前N行,返回 N ~ N+M 行的記錄,如果N值非常大,效率極差(表記錄1500w,N=10000000,M=30 需要9秒)。
解決辦法:SQL:SELECT id FROM ttl_product_info WHERE id > N LIMIT M,id 列是索引列,id > N屬于 range 級別,效率自然高,然后從位置開始取30條記錄,效率極高(表記錄1500w,N=10000000,M=30,需要0.9毫秒)。
當然想要實現(xiàn)上述效果的前提是:
id是唯一索引,而且單調(diào)遞增。
N 的值是上一次查詢的記錄的最后一條id,(需要前端保存一下,不能直接用傳統(tǒng)的方法獲得)
不支持跨頁查詢,只能按照第1,2,3,4頁這樣查詢逐頁查詢。