何謂事務?
我們設想一個場景,這個場景中我們需要插入多條相關聯的數據到數據庫,不幸的是,這個過程可能會遇到下面這些問題:
- 數據庫中途突然因為某些原因掛掉了。
- 客戶端突然因為網絡原因連接不上數據庫了。
- 并發(fā)訪問數據庫時,多個線程同時寫入數據庫,覆蓋了彼此的更改。
- ……
上面的任何一個問題都可能會導致數據的不一致性。為了保證數據的一致性,系統(tǒng)必須能夠處理這些問題。事務就是我們抽象出來簡化這些問題的首選機制。事務的概念起源于數據庫,目前,已經成為一個比較廣泛的概念。
何為事務? 一言蔽之,事務是邏輯上的一組操作,要么都執(zhí)行,要么都不執(zhí)行。
事務最經典也經常被拿出來說例子就是轉賬了。假如小明要給小紅轉賬 1000 元,這個轉賬會涉及到兩個關鍵操作,這兩個操作必須都成功或者都失敗。
事務會把這兩個操作就可以看成邏輯上的一個整體,這個整體包含的操作要么都成功,要么都要失敗。這樣就不會出現小明余額減少而小紅的余額卻并沒有增加的情況。
何謂數據庫事務?
大多數情況下,我們在談論事務的時候,如果沒有特指分布式事務,往往指的就是數據庫事務。
數據庫事務在我們日常開發(fā)中接觸的最多了。如果你的項目屬于單體架構的話,你接觸到的往往就是數據庫事務了。
那數據庫事務有什么作用呢?
簡單來說,數據庫事務可以保證多個對數據庫的操作(也就是 SQL 語句)構成一個邏輯上的整體。構成這個邏輯上的整體的這些數據庫操作遵循:要么全部執(zhí)行成功,要么全部不執(zhí)行 。
# 開啟一個事務START TRANSACTION;# 多條 SQL 語句SQL1,SQL2…## 提交事務COMMIT;
另外,關系型數據庫(例如:MySQL、SQL Server、Oracle 等)事務都有 ACID 特性:
ACID
這里要額外補充一點:只有保證了事務的持久性、原子性、隔離性之后,一致性才能得到保障。也就是說 A、I、D 是手段,C 是目的!
并發(fā)事務帶來了哪些問題?
在典型的應用程序中,多個事務并發(fā)運行,經常會操作相同的數據來完成各自的任務(多個用戶對同一數據進行操作)。并發(fā)雖然是必須的,但可能會導致以下的問題。
- 臟讀(Dirty read): 當一個事務正在訪問數據并且對數據進行了修改,而這種修改還沒有提交到數據庫中,這時另外一個事務也訪問了這個數據,然后使用了這個數據。因為這個數據是還沒有提交的數據,那么另外一個事務讀到的這個數據是“臟數據”,依據“臟數據”所做的操作可能是不正確的。
- 丟失修改(Lost to modify): 指在一個事務讀取一個數據時,另外一個事務也訪問了該數據,那么在第一個事務中修改了這個數據后,第二個事務也修改了這個數據。這樣第一個事務內的修改結果就被丟失,因此稱為丟失修改。例如:事務 1 讀取某表中的數據 A=20,事務 2 也讀取 A=20,事務 1 修改 A=A-1,事務 2 也修改 A=A-1,最終結果 A=19,事務 1 的修改被丟失。
- 不可重復讀(Unrepeatable read): 指在一個事務內多次讀同一數據。在這個事務還沒有結束時,另一個事務也訪問該數據。那么,在第一個事務中的兩次讀數據之間,由于第二個事務的修改導致第一個事務兩次讀取的數據可能不太一樣。這就發(fā)生了在一個事務內兩次讀到的數據是不一樣的情況,因此稱為不可重復讀。
- 幻讀(Phantom read): 幻讀與不可重復讀類似。它發(fā)生在一個事務(T1)讀取了幾行數據,接著另一個并發(fā)事務(T2)插入了一些數據時。在隨后的查詢中,第一個事務(T1)就會發(fā)現多了一些原本不存在的記錄,就好像發(fā)生了幻覺一樣,所以稱為幻讀。
不可重復讀和幻讀區(qū)別 :不可重復讀的重點是修改比如多次讀取一條記錄發(fā)現其中某些列的值被修改,幻讀的重點在于新增或者刪除比如多次查詢同一條查詢語句(DQL)時,記錄發(fā)現記錄增多或減少了。
SQL 標準定義了哪些事務隔離級別?
SQL 標準定義了四個隔離級別:
- READ-UNCOMMITTED(讀取未提交) :最低的隔離級別,允許讀取尚未提交的數據變更,可能會導致臟讀、幻讀或不可重復讀。
- READ-COMMITTED(讀取已提交) :允許讀取并發(fā)事務已經提交的數據,可以阻止臟讀,但是幻讀或不可重復讀仍有可能發(fā)生。
- REPEATABLE-READ(可重復讀) :對同一字段的多次讀取結果都是一致的,除非數據是被本身事務自己所修改,可以阻止臟讀和不可重復讀,但幻讀仍有可能發(fā)生。
- SERIALIZABLE(可串行化) :最高的隔離級別,完全服從 ACID 的隔離級別。所有的事務依次逐個執(zhí)行,這樣事務之間就完全不可能產生干擾,也就是說,該級別可以防止臟讀、不可重復讀以及幻讀。
隔離級別臟讀不可重復讀幻讀READ-UNCOMMITTED READ-COMMITTED REPEATABLE-READ SERIALIZABLE
MySQL 的隔離級別是基于鎖實現的嗎?
MySQL 的隔離級別基于鎖和 MVCC 機制共同實現的。
SERIALIZABLE 隔離級別,是通過鎖來實現的。除了 SERIALIZABLE 隔離級別,其他的隔離級別都是基于 MVCC 實現。
不過, SERIALIZABLE 之外的其他隔離級別可能也需要用到鎖機制,就比如 REPEATABLE-READ 在當前讀情況下需要使用加鎖讀來保證不會出現幻讀。
MySQL 的默認隔離級別是什么?
MySQL InnoDB 存儲引擎的默認支持的隔離級別是 REPEATABLE-READ(可重讀)。我們可以通過SELECT @@tx_isolation;命令來查看,MySQL 8.0 該命令改為SELECT @@transaction_isolation;
mysql> SELECT @@tx_isolation;+—————–+| @@tx_isolation |+—————–+| REPEATABLE-READ |+—————–+
從上面對 SQL 標準定義了四個隔離級別的介紹可以看出,標準的 SQL 隔離級別定義里,REPEATABLE-READ(可重復讀)是不可以防止幻讀的。
但是!InnoDB 實現的 REPEATABLE-READ 隔離級別其實是可以解決幻讀問題發(fā)生的,主要有下面兩種情況:
- 快照讀 :由 MVCC 機制來保證不出現幻讀。
- 當前讀 :使用 Next-Key Lock 進行加鎖來保證不出現幻讀,Next-Key Lock 是行鎖(Record Lock)和間隙鎖(Gap Lock)的結合,行鎖只能鎖住已經存在的行,為了避免插入新行,需要依賴間隙鎖。
因為隔離級別越低,事務請求的鎖越少,所以大部分數據庫系統(tǒng)的隔離級別都是 READ-COMMITTED ,但是你要知道的是 InnoDB 存儲引擎默認使用 REPEATABLE-READ 并不會有任何性能損失。
InnoDB 存儲引擎在分布式事務的情況下一般會用到 SERIALIZABLE 隔離級別。