count是聚合函式嗎?
count()聚合計算
count()是聚合函式,對於返回的結果集,一行行地判斷,累計值加1,最後返回累計值,count(*)、count(主鍵ID)和count(1)表示返回滿足條件的結果集的總行數。
count()聚合函式統計非NULL與NULL值的區別:
1、count(欄位)不統計NULL記錄,即表示滿足條件的資料行裡引數欄位不為NULL的行
2、count(1)和count(*)會記錄NULL值
count(主鍵ID)、count(欄位)、count(1)、count(*)的區別和效能差異(分析效能差別的原則)
1、server層要什麼就給什麼
2、InnoDB只給必要的值
3、現在的最佳化器對count(*)的取行數做了最佳化,其他沒有做最佳化
count(主鍵ID)比count(1)慢的原因
對於 count(主鍵 ID) 來說,InnoDB 引擎會遍歷主鍵索引樹,把每一行的ID值取出來,返回給server層,server層拿到ID後,判斷是不可能為空的,按行累加加1,最後返回累計值。
對於count(1),InnoDB引擎會掃描主鍵索引樹,但不取值,server層對於返回的每一行,按行累計加1,判斷不可能為NULL,返回累計值。
從InnoDB引擎層返回ID會涉及到解析資料行、複製欄位值的操作,因此count(主鍵 ID)執行要比count(1)執行慢。
count(欄位)
1、如果這個欄位定義為not null的話,一行行地從記錄裡面讀出這個欄位,判斷不能為null,按行累計加1
2、如果這個欄位定義允許為null,一行行地從記錄裡面讀出這個欄位,執行的時候還要判斷是否為null,不為null的按行累計加1,返回累加值
count(主鍵id)走主鍵索引的時候效率較count(*)差的原因?
平時我們檢索一列的時候,基本上等值或範圍查詢,那麼索引基數大的索引必然效率很高(符合走主鍵索引查詢速度最快的原則)。
但是在做count(*)的時候並沒有檢索具體的一行或者一個範圍,那麼選擇基數小的索引對count操作效率會更高。在做count操作的時候,mysql會遍歷每個葉子節點,所以基數越小,效率越高。mysql非聚簇索引葉子節點儲存指向主鍵ID的指標,所以需要檢索兩遍索引。但是這裡相對於遍歷主鍵索引,即使檢索兩遍索引效率也比單純的檢索主鍵索引快。
Innodb是索引組織表,主鍵索引樹的葉子節點是資料,而普通索引樹的葉子節點是主鍵值,索引普通索引樹小很多,索引長度越小樹的大小就越小。
MyISAM與InnoDB,正如在不同的儲存引擎中,count(*)函式的執行是不同的
在MyISAM儲存引擎中,count()函式是直接讀取資料表儲存的行記錄數並返回,效率很高,但是如果添加了where條件的話,MyISAM表也不能返回得很快。
在InnoDB儲存引擎中,count(*)函式是先從記憶體中讀取表中的資料到記憶體緩衝區,然後掃描全表獲得行記錄數。在使用count函式中加上where條件時,在兩個儲存引擎中的效果是一樣的,都會掃描全表計算某欄位有值項的次數。
count(*)中關於select count(*) from tab_name幾種不走索引和走那種索引情景分析
CREATE TABLE`t1` (
`c1`varchar(30) NOT NULL,
`c2`varchar(20) NOT NULL,
`c3`varchar(40) NOT NULL,
`c4`varchar(10) DEFAULT NULL)
ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT=‘ceshi_count’