一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)庫字段要使用NOT NULL究竟是為何?

數(shù)據(jù)分析與開發(fā) ? 來源:博客園 ? 作者:艾小仙 ? 2021-04-19 15:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近剛?cè)肼毿鹿荆l(fā)現(xiàn)數(shù)據(jù)庫設(shè)計有點(diǎn)小問題,數(shù)據(jù)庫字段很多沒有NOT NULL,對于強(qiáng)迫癥晚期患者來說,簡直難以忍受,因此有了這篇文章。

基于目前大部分的開發(fā)現(xiàn)狀來說,我們都會把字段全部設(shè)置成NOT NULL并且給默認(rèn)值的形式。

通常,對于默認(rèn)值一般這樣設(shè)置:

整形,我們一般使用0作為默認(rèn)值。

字符串,默認(rèn)空字符串

時間,可以默認(rèn)1970-01-01 0801,或者默認(rèn)0000-00-00 0000,但是連接參數(shù)要添加zeroDateTimeBehavior=convertToNull,建議的話還是不要用這種默認(rèn)的時間格式比較好

但是,考慮下原因,為什么要設(shè)置成NOT NULL?

來自高性能Mysql中有這樣一段話:

盡量避免NULL

很多表都包含可為NULL(空值)的列,即使應(yīng)用程序并不需要保存NULL也是如此,這是因?yàn)榭蔀镹ULL是列的默認(rèn)屬性。通常情況下最好指定列為NOT NULL,除非真的需要存儲NULL值。

如果查詢中包含可為NULL的列,對MySql來說更難優(yōu)化,因?yàn)榭蔀镹ULL的列使得索引、索引統(tǒng)計和值比較都更復(fù)雜??蔀镹ULL的列會使用更多的存儲空間,在MySql里也需要特殊處理。當(dāng)可為NULL的列被索引時,每個索引記錄需要一個額外的字節(jié),在MyISAM里甚至還可能導(dǎo)致固定大小的索引(例如只有一個整數(shù)列的索引)變成可變大小的索引。

通常把可為NULL的列改為NOT NULL帶來的性能提升比較小,所以(調(diào)優(yōu)時)沒有必要首先在現(xiàn)有schema中查找并修改掉這種情況,除非確定這會導(dǎo)致問題。但是,如果計劃在列上建索引,就應(yīng)該盡量避免設(shè)計成可為NULL的列。

當(dāng)然也有例外,例如值得一提的是,InnoDB使用單獨(dú)的位(bit)存儲NULL值,所以對于稀疏數(shù)據(jù)有很好的空間效率。但這一點(diǎn)不適用于MyISAM。

書中的描述說了幾個主要問題,我這里暫且拋開MyISAM的問題不談,這里我針對InnoDB作為考量條件。

如果不設(shè)置NOT NULL的話,NULL是列的默認(rèn)值,如果不是本身需要的話,盡量就不要使用NULL

使用NULL帶來更多的問題,比如索引、索引統(tǒng)計、值計算更加復(fù)雜,如果使用索引,就要避免列設(shè)置成NULL

如果是索引列,會帶來的存儲空間的問題,需要額外的特殊處理,還會導(dǎo)致更多的存儲空間占用

對于稀疏數(shù)據(jù)有更好的空間效率,稀疏數(shù)據(jù)指的是很多值為NULL,只有少數(shù)行的列有非NULL值的情況

默認(rèn)值

對于MySql而言,如果不主動設(shè)置為NOT NULL的話,那么插入數(shù)據(jù)的時候默認(rèn)值就是NULL。

NULL和NOT NULL使用的空值代表的含義是不一樣,NULL可以認(rèn)為這一列的值是未知的,空值則可以認(rèn)為我們知道這個值,只不過他是空的而已。

舉個例子,一張表中的某一條name字段是NULL,我們可以認(rèn)為不知道名字是什么,反之如果是空字符串則可以認(rèn)為我們知道沒有名字,他就是一個空值。

而對于大多數(shù)程序的情況而言,沒有什么特殊需要非要字段要NULL的吧,NULL值反而會對程序造成比如空指針的問題。

對于現(xiàn)狀大部分使用MyBatis的情況來說,我建議使用默認(rèn)生成的insertSelective方法或者純手動寫插入方法,可以避免新增NOT NULL字段導(dǎo)致的默認(rèn)值不生效或者插入報錯的問題。

值計算

聚合函數(shù)不準(zhǔn)確

對于NULL值的列,使用聚合函數(shù)的時候會忽略NULL值。

現(xiàn)在我們有一張表,name字段默認(rèn)是NULL,此時對name進(jìn)行count得出的結(jié)果是1,這個是錯誤的。

count(*)是對表中的行數(shù)進(jìn)行統(tǒng)計,count(name)則是對表中非NULL的列進(jìn)行統(tǒng)計。

5e7ffcca-9f5a-11eb-8b86-12bb97331649.jpg

=失效

對于NULL值的列,是不能使用=表達(dá)式進(jìn)行判斷的,下面對name的查詢是不成立的,必須使用is NULL。

5e908a04-9f5a-11eb-8b86-12bb97331649.jpg

與其他值運(yùn)算

NULL和其他任何值進(jìn)行運(yùn)算都是NULL,包括表達(dá)式的值也是NULL。

user表第二條記錄age是NULL,所以+1之后還是NULL,name是NULL,進(jìn)行concat運(yùn)算之后結(jié)果還是NULL。

5e98c872-9f5a-11eb-8b86-12bb97331649.jpg

可以再看下下面的例子,任何和NULL進(jìn)行運(yùn)算的話得出的結(jié)果都會是NULL,想象下你設(shè)計的某個字段如果是NULL還不小心進(jìn)行各種運(yùn)算,最后得出的結(jié)果。。。

5ea43040-9f5a-11eb-8b86-12bb97331649.jpg

distinct、group by、order by

對于distinct和group by來說,所有的NULL值都會被視為相等,對于order by來說升序NULL會排在最前

5eca059a-9f5a-11eb-8b86-12bb97331649.jpg

其他問題

表中只有一條有名字的記錄,此時查詢名字!=a預(yù)期的結(jié)果應(yīng)該是想查出來剩余的兩條記錄,會發(fā)現(xiàn)與預(yù)期結(jié)果不匹配。

5ed4b576-9f5a-11eb-8b86-12bb97331649.jpg

索引問題

為了驗(yàn)證NULL字段對索引的影響,分別對name和age添加索引。

5eea93f0-9f5a-11eb-8b86-12bb97331649.jpg

關(guān)于網(wǎng)上很多說如果NULL那么不能使用索引的說法,這個描述其實(shí)并不準(zhǔn)確,根據(jù)引用官方文檔[3]里描述,使用is NULL和范圍查詢都是可以和正常一樣使用索引的,實(shí)際驗(yàn)證的結(jié)果好像也是這樣,看以下例子。

5ef74ffa-9f5a-11eb-8b86-12bb97331649.jpg

然后接著我們往數(shù)據(jù)庫中繼續(xù)插入一些數(shù)據(jù)進(jìn)行測試,當(dāng)NULL列值變多之后發(fā)現(xiàn)索引失效了。

5f027aec-9f5a-11eb-8b86-12bb97331649.jpg

我們知道,一個查詢SQL執(zhí)行大概是這樣的流程:

5f0caefe-9f5a-11eb-8b86-12bb97331649.jpg

首先連接器負(fù)責(zé)連接到指定的數(shù)據(jù)庫上,接著看看查詢緩存中是否有這條語句,如果有就直接返回結(jié)果。

如果緩存沒有命中的話,就需要分析器來對SQL語句進(jìn)行語法和詞法分析,判斷SQL語句是否合法。

現(xiàn)在來到優(yōu)化器,就會選擇使用什么索引比較合理,SQL語句具體怎么執(zhí)行的方案就確定下來了。

最后執(zhí)行器負(fù)責(zé)執(zhí)行語句、有無權(quán)限進(jìn)行查詢,返回執(zhí)行結(jié)果。

從上面的簡單測試結(jié)果其實(shí)可以看到,索引列存在NULL就會存在書中所說的導(dǎo)致優(yōu)化器在做索引選擇的時候更復(fù)雜,更加難以優(yōu)化。

存儲空間

數(shù)據(jù)庫中的一行記錄在最終磁盤文件中也是以行的方式來存儲的,對于InnoDB來說,有4種行存儲格式:REDUNDANT、COMPACT、DYNAMIC和COMPRESSED。

InnoDB的默認(rèn)行存儲格式是COMPACT,存儲格式如下所示,虛線部分代表可能不一定會存在。

5f14e5e2-9f5a-11eb-8b86-12bb97331649.jpg

變長字段長度列表:有多個字段則以逆序存儲,我們只有一個字段所有不考慮那么多,存儲格式是16進(jìn)制,如果沒有變長字段就不需要這一部分了。

NULL值列表:用來存儲我們記錄中值為NULL的情況,如果存在多個NULL值那么也是逆序存儲,并且必須是8bit的整數(shù)倍,如果不夠8bit,則高位補(bǔ)0。1代表是NULL,0代表不是NULL。如果都是NOT NULL那么這個就存在了。

ROW_ID:一行記錄的唯一標(biāo)志,沒有指定主鍵的時候自動生成的ROW_ID作為主鍵。

TRX_ID:事務(wù)ID。

ROLL_PRT:回滾指針。

最后就是每列的值。

為了說明清楚這個存儲格式的問題,我弄張表來測試,這張表只有c1字段是NOT NULL,其他都是可以為NULL的。

5f25503a-9f5a-11eb-8b86-12bb97331649.jpg

可變字段長度列表:c1和c3字段值長度分別為1和2,所以長度轉(zhuǎn)換為16進(jìn)制是0x01 0x02,逆序之后就是0x02 0x01。

NULL值列表:因?yàn)榇嬖谠试S為NULL的列,所以c2,c3,c4分別為010,逆序之后還是一樣,同時高位補(bǔ)0滿8位,結(jié)果是00000010。

其他字段我們暫時不管他,最后第一條記錄的結(jié)果就是,當(dāng)然這里我們就不考慮編碼之后的結(jié)果了。

5f464196-9f5a-11eb-8b86-12bb97331649.jpg

這樣就是一個完整的數(shù)據(jù)行數(shù)據(jù)的格式,反之,如果我們把所有字段都設(shè)置為NOT NULL,并且插入一條數(shù)據(jù)a,bb,ccc,dddd的話,存儲格式應(yīng)該這樣:

5f55fdf2-9f5a-11eb-8b86-12bb97331649.jpg

雖然我們發(fā)現(xiàn)NULL本身并不會占用存儲空間,但是如果存在NULL的話就會多占用一個字節(jié)的標(biāo)志位的空間。

文章參考文檔:

https://dev.mysql.com/doc/refman/8.0/en/problems-with-null.html

https://dev.mysql.com/doc/refman/8.0/en/working-with-null.html

https://dev.mysql.com/doc/refman/5.6/en/is-null-optimization.html

https://dev.mysql.com/doc/refman/5.6/en/innodb-row-format.html

https://www.cnblogs.com/zhoujinyi/articles/2726462.html

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SQL
    SQL
    +關(guān)注

    關(guān)注

    1

    文章

    783

    瀏覽量

    45148
  • 數(shù)據(jù)庫
    +關(guān)注

    關(guān)注

    7

    文章

    3927

    瀏覽量

    66236
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4381

    瀏覽量

    64889
  • null
    +關(guān)注

    關(guān)注

    0

    文章

    19

    瀏覽量

    4129

原文標(biāo)題:為什么數(shù)據(jù)庫字段要使用NOT NULL?

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫被加密如何恢復(fù)數(shù)據(jù)?

    SQL Server數(shù)據(jù)庫故障: SQL Server數(shù)據(jù)庫被加密,無法使用。 數(shù)據(jù)庫MDF、LDF、log日志文件名字被篡改。
    的頭像 發(fā)表于 06-25 13:54 ?138次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>被加密如何恢復(fù)<b class='flag-5'>數(shù)據(jù)</b>?

    MySQL數(shù)據(jù)庫是什么

    開發(fā)、企業(yè)應(yīng)用和大數(shù)據(jù)場景。以下是其核心特性和應(yīng)用場景的詳細(xì)說明: 核心特性 關(guān)系型數(shù)據(jù)庫模型 數(shù)據(jù)以 表(Table) 形式組織,表由行(記錄)和列(字段)構(gòu)成。 通過 主鍵、外鍵
    的頭像 發(fā)表于 05-23 09:18 ?452次閱讀

    室內(nèi)導(dǎo)航究竟是如何實(shí)現(xiàn)的

    作為物聯(lián)網(wǎng)智能硬件的引領(lǐng)者,云里物里當(dāng)然不是來聊電影的,而是想借此機(jī)會,和大家探討一下:室內(nèi)導(dǎo)航究竟是如何實(shí)現(xiàn)的?它背后的技術(shù)原理是什么?接下來,讓我們一起揭開室內(nèi)導(dǎo)航的神秘面紗。
    的頭像 發(fā)表于 02-12 13:50 ?520次閱讀

    ADS1298R PACE_OUT1和PACE_OUT2這兩條引腿究竟是輸入還是輸出?有什么用?怎樣使用?

    PACE_OUT1和PACE_OUT2這兩條引腿究竟是輸入還是輸出?有什么用?怎樣使用?
    發(fā)表于 02-12 07:56

    MySQL數(shù)據(jù)庫的安裝

    MySQL數(shù)據(jù)庫的安裝 【一】各種數(shù)據(jù)庫的端口 MySQL :3306 Redis :6379 MongoDB :27017 Django :8000 flask :5000 【二】MySQL 介紹
    的頭像 發(fā)表于 01-14 11:25 ?565次閱讀
    MySQL<b class='flag-5'>數(shù)據(jù)庫</b>的安裝

    數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?

    數(shù)據(jù)庫是一種部署在虛擬計算環(huán)境中的數(shù)據(jù)庫,它融合了云計算的彈性和可擴(kuò)展性,為用戶提供高效、靈活的數(shù)據(jù)庫服務(wù)。云數(shù)據(jù)庫主要分為兩大類:關(guān)系型數(shù)據(jù)庫
    的頭像 發(fā)表于 01-07 10:22 ?511次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫表記錄丟失的數(shù)據(jù)恢復(fù)流程

    Mysql數(shù)據(jù)庫故障: Mysql數(shù)據(jù)庫表記錄丟失。 Mysql數(shù)據(jù)庫故障表現(xiàn): 1、Mysql數(shù)據(jù)庫表中無任何數(shù)據(jù)或只有部分
    的頭像 發(fā)表于 12-16 11:05 ?615次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—Mysql<b class='flag-5'>數(shù)據(jù)庫</b>表記錄丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)流程

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MYSQL數(shù)據(jù)庫ibdata1文件損壞的數(shù)據(jù)恢復(fù)案例

    mysql數(shù)據(jù)庫故障: mysql數(shù)據(jù)庫文件ibdata1、MYI、MYD損壞。 故障表現(xiàn):1、數(shù)據(jù)庫無法進(jìn)行查詢等操作;2、使用mysqlcheck和myisamchk無法修復(fù)數(shù)據(jù)庫
    的頭像 發(fā)表于 12-09 11:05 ?635次閱讀

    SQL數(shù)據(jù)庫設(shè)計的基本原則

    SQL數(shù)據(jù)庫設(shè)計的基本原則 1. 理解需求 在設(shè)計數(shù)據(jù)庫之前,首先要與業(yè)務(wù)團(tuán)隊緊密合作,了解業(yè)務(wù)需求。這包括數(shù)據(jù)的類型、數(shù)據(jù)的使用方式、數(shù)據(jù)
    的頭像 發(fā)表于 11-19 10:23 ?738次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—通過拼接數(shù)據(jù)庫碎片恢復(fù)SQLserver數(shù)據(jù)庫

    一個運(yùn)行在存儲上的SQLServer數(shù)據(jù)庫,有1000多個文件,大小幾十TB。數(shù)據(jù)庫每10天生成一個NDF文件,每個NDF幾百GB大小。數(shù)據(jù)庫包含兩個LDF文件。 存儲損壞,數(shù)據(jù)庫
    的頭像 發(fā)表于 10-31 13:21 ?697次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—通過拼接<b class='flag-5'>數(shù)據(jù)庫</b>碎片恢復(fù)SQLserver<b class='flag-5'>數(shù)據(jù)庫</b>

    PCM1861 INT腳究竟是輸出還是輸入?

    這個芯片activce或是idle. 是否有人解釋下,INT腳究竟是輸出還是輸入。我希望是輸出,我需要讀取到是否有analog audio輸入的信息。 或者,輸入輸出與否還要靠其他什么地方設(shè)置? 盼望有人回復(fù)解答,不勝感激!
    發(fā)表于 10-29 07:29

    揭秘貼片功率電感發(fā)燙究竟是不是燒壞了

    電子發(fā)燒友網(wǎng)站提供《揭秘貼片功率電感發(fā)燙究竟是不是燒壞了.docx》資料免費(fèi)下載
    發(fā)表于 09-30 14:44 ?1次下載

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯誤的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫故障: SQL Server附加數(shù)據(jù)庫出現(xiàn)錯誤823,附加數(shù)據(jù)庫失敗。數(shù)據(jù)庫沒有備份,無法通過備份恢復(fù)數(shù)據(jù)庫。
    的頭像 發(fā)表于 09-20 11:46 ?705次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>出現(xiàn)823錯誤的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    電感器線徑究竟是粗好還是細(xì)好

    電子發(fā)燒友網(wǎng)站提供《電感器線徑究竟是粗好還是細(xì)好.docx》資料免費(fèi)下載
    發(fā)表于 09-20 11:25 ?0次下載

    tas5756m使用GPIO口加內(nèi)部PLL產(chǎn)生MCLK的方法究竟是怎么樣的?

    tas5756m使用GPIO口加內(nèi)部PLL產(chǎn)生MCLK的方法究竟是怎么樣的?
    發(fā)表于 08-19 06:06