[동시성 제어] 트랜잭션 격리 수준과 낙관적/비관적 락의 필요성

비관적 락과 낙관적 락에 대한 공부 자료는 저 이외에도 충분하다고 판단하여, 해당 글에서는 설명하지 않습니다.
락에 대해 학습하고 있는 중이기 때문에, 틀린 부분이 있을 수 있습니다. 발견하신다면 댓글로 남겨주시면 감사하겠습니다.

트랜잭션과 격리 수준을 이해해서 낙관적, 비관적 락을 왜 사용하는지에 대해 알아봅니다.

1. 트랜잭션의 격리 수준(Isolation level) 이해하기

트랜잭션의 격리 수준(isolation)이란?

데이터의 일관성을 유지 하기 위해 여러 트랜잭션이 서로에게 영향을 미칠 수 있는 범위를 어느 정도로 제한할 지를 레벨로 나눈 것입니다.

예를 들면, A트랜잭션에서 id=1 에 대한 레코드를 조회 할 때, B트랜잭션에서 id=1 에 대한 레코드를 변경했다고 가정합니다.

이 때, A트랜잭션의 결과가 B트랜잭션에 의해 변경된다면 "두 트랜잭션은 격리가 되지 않았다"고 말합니다.

즉, 트랜잭션 격리 수준에 따라 데이터의 일관성이 지켜질 수도, 깨질 수도 있습니다.

그렇다면 트랜잭션의 격리 수준이 어떨 때, 어떤 문제가 발생해서 데이터의 일관성이 지켜지지 않을까요?

2번에서 알아보겠습니다.

2. 트랜잭션의 격리 수준 4단계와 이에 따라 발생하는 문제 3가지

SQL 표준에서는 트랜잭션이 동시에 진행 될 때,

발생할 수 있는 문제의 종류에 따라 트랜잭션의 격리 수준을 아래의 표처럼 나누었습니다.

Isolation level 에 따라 발생할 수 있는 문제는 "O" 이고, 발생하지 않으면 "X" 입니다.

Isolation Level	Dirty Read Problem	Non Repeatable Read Problem	Phantom Read Problem
Read Uncommitted	O	O	O
Read Committed	X	O	O
Repeatable Read	X	X	O
Serializable	X	X	X

트랜잭션이 동시에 진행될 때, 발생할 수 있는 문제를 알아보겠습니다.

문제 1. Dirty Read Problem

한 트랜잭션에서 변경한 값을 다른 트랜잭션에서 읽을 때 발생합니다.
예를 들어, 아래 표에서 T1이 a 값을 변경하고 롤백할 경우, a 값은 실제로 DB에 반영되지 않아야 합니다.
그러나 T2는 이 변경된 a 값을 읽어 마치 DB에 반영된 것처럼 사용할 수 있습니다.
트랜잭션 격리 수준을 Read Committed로 올리면, 커밋되거나 롤백된 트랜잭션만 읽을 수 있게 되어 이 문제를 방지할 수 있습니다.

문제 2. Non-repeatable Read Problem

한 트랜잭션에서 같은 값을 두 번 읽었을 때 각각 다른 값이 읽히는 경우를 뜻합니다.
예를 들어, T1이 처음에 a 값을 읽었는데, T2가 그 사이에 a 값을 삭제하고 변경 사항을 DB에 반영한 경우, T1이 다시 a 값을 읽으려 할 때 a 값은 더 이상 존재하지 않게 됩니다. 따라서 T1이 처음 읽은 a 값과 나중에 읽은 a 값이 달라집니다.
- 즉, 트랜잭션1이 트랜잭션2의 반영 결과를 읽음으로써 생기는 문제입니다.
트랜잭션 격리 수준을 Repeatable Read 로 올려서 트랜잭션이 시작된 후, 다른 트랜잭션의 변경 사항을 읽지 않음으로써 이 문제를 방지할 수 있습니다.

문제 3. Phantom Read Problem

한 트랜잭션에서 한 값을 두 번 읽을 때, 없던 값이 생겨서 데이터 수가 변하는 경우입니다.
예시는 Non-Repeatable Read Problem 과 유사하며,
Non-Repeatable Read 은 같은 데이터의 변경으로 인해 발생하는 문제라면, Phantom Read 는 데이터의 삽입에 의해 찾고자 하는 데이터의 개수가 달라졌을 때의 의미입니다.
https://stackoverflow.com/questions/11043712/non-repeatable-read-vs-phantom-read

이렇게 트랜잭션끼리 격리 되지 않는다면,
데이터 정합성에 문제가 생기기 때문에 트랜잭션 끼리 영향을 끼치지 않도록 트랜잭션들을 격리 시켜야만 합니다.


물론, 이런 문제들이 모두 발생하지 않게 할 수 있지만,
그만큼 제약사항이 많아져 동시 처리 가능한 트랜잭션 수가 줄어들어 결국 DB의 전체 처리량이 하락하게 됩니다.( == 성능이 나빠집니다)


그래서, 일부 이상한 현상은 허용하는 몇 가지 level 을 만들어서 사용자 필요에 따라 선택하도록 한 것이 트랜잭션 격리 수준 4단계입니다.

이제, 이 문제들을 막을 수 있는 트랜잭션의 격리 수준 4단계를 알아보겠습니다.

격리 수준 1단계 : Read Uncommitted

가장 낮은 격리 수준으로, 하나의 트랜잭션이 다른 트랜잭션의 커밋되지 않은 데이터를 읽을 수 있습니다.
이로 인해, Dirty Read, Non-Repeatable Read, Phantom Read 문제가 발생합니다.
커밋되지 않은 데이터를 읽을 수 있기 때문에 4단계 격리 수준 중 성능이 가장 빠르지만(트랜잭션 처리량이 가장 많지만), 데이터의 일관성을 보장할 수 없습니다.

격리 수준 2단계 : Read committed

트랜잭션이 데이터를 읽을 때, 다른 트랜잭션의 커밋된 데이터를 읽게 되며 다른 트랜잭션의 결과를 반영합니다.
Non-Repeatable Read 와 Phantom Read 는 여전히 발생합니다.

격리 수준 3단계 : Repeatable Read

한 트랜잭션이 다른 트랜잭션의 결과를 반영하지 않음으로써 동일한 데이터를 여러 번 읽을 때마다 같은 결과를 보장합니다.
Phantom Read 는 여전히 발생합니다.

격리 수준 4단계 : Serializable

가장 높은 격리 수준으로, 트랜잭션이 순차적으로 실행되는 것처럼 보장합니다.
그렇기 때문에, 데이터 일관성을 유지할 수 있지만 성능이 매우 떨어집니다.

3. 트랜잭션 격리 수준과 "Lock" 의 관계

과거의 DBMS는 트랜잭션 격리 수준을 4단계로 구분하였고, 격리 수준 구현을 위해 처음에는 read Lock(S-Lock, shared Lock) 과 write Lock(X-Lock, exclusive Lock) 을 활용했습니다.

read Lock (S-Lock, shared Lock)
- 한 트랜잭션이 id=3 에 대한 레코드에 read Lock 을 획득하면, 다른 트랜잭션은 id=3 에 대한 레코드를 읽기만 할 수 있고, 변경할 수 없습니다.
write Lock (X-Lock, exclusive Lock)
- 한 트랜잭션이 id=3 에 대한 레코드에 write Lock 을 획득하면, 다른 트랜잭션은 id=3 에 대한 레코드를 읽을 수도 변경할 수도 없습니다.

하지만, read Lock 과 write Lock 을 이용해서 격리 수준을 구현하다 보니, 단순히 레코드를 읽기만 하는데도 트랜잭션간의 동시 처리량이 낮아졌습니다.

예를 들어, A 트랜잭션이 id=3 인 레코드를 변경하기 위해 write Lock 을 획득하면, B 트랜잭션이 id=3인 레코드를 읽고만 싶어도 read Lock 을 획득 할 수 없었습니다.

즉, read Lock 과 write Lock 을 동시에 획득하지 못하고 업데이트 중에는 읽기가 블록되어 처리량이 떨어진다는 것이었습니다.

	read Lock	write Lock
read Lock	O	X
write Lock	X	X

4. MVCC(Mulit Version Concurrency Control) 의 등장

read/write Lock 만을 사용해서 4단계의 격리 수준을 구현하게 되자 트랜잭션의 처리량이 너무 낮았고, 단순 읽기 하는 트랜잭션 처리도 느렸습니다.
이를 극복하기 위해 MVCC 가 현대의 DBMS에 등장하게 되었습니다.

MVCC 란?

MVCC의 목적은 잠금을 사용하지 않고 일관된 읽기는 제공하는 데 있습니다.
일관된 읽기를 위해 Lock 이 아닌 스냅샷을 이용하는 방식입니다.

MVCC의 등장으로 인해, 잠금 없이 일관된 데이터를 읽을 수 있게 되어 여러 트랜잭션이 레코드를 읽는 처리량이 높아지게 되었습니다.

5. MySQL 의 MVCC와 낙관적, 비관적 락의 관계

그렇다면, MySQL 은 MVCC 를 어떻게 활용하고 있을까요?

MySQL 8.0 의 default 트랜잭션 격리 수준은 Repeatable Read 이며, MVCC를 이용하여 잠금 없이 레코드의 읽기 일관성을 지원해주고 있습니다.

MySQL 의 Repeatable Read 격리 수준에서는 MVCC를 사용해서 잠금 없이 읽기 일관성을 지원하고 있습니다. 그리고, 해당 격리 수준에서 발생할 수 있는 Phantom Read 문제는 넥스트 키 락을 사용해 방지하고 있습니다.

그러나, MVCC를 사용하게 되며 트랜잭션이 다른 트랜잭션의 결과를 반영하지 않다보니 여러 트랜잭션이 하나의 데이터를 변경할 때 생기는 문제를 막을 수는 없었습니다. 이를 Lost Update 문제라 부릅니다.

Lost Update 란?

A트랜잭션도 id=3 레코드에 대해 쓰기작업을 하고, B 트랜잭션도 id=3 레코드에 대해 쓰기작업을 할 때, A트랜잭션의 결과가 B트랜잭션 결과에 의해 덮어씌어져서 A트랜잭션의 결과가 DB에 반영되지 않는 것입니다.
즉, 은행같이 금액이 중요한 부분에서 id=3 인 레코드에 한 번은 500원 입금하고, 다른 때는 1000원 입금했을 때, 1500원이 아니라 1000원이 남아있을 수 있습니다.

그렇기에 MySQL의 Repeatable Read 격리 수준에서 "A 트랜잭션은 B/C 와 같이 다른 트랜잭션의 결과가 반영하지 않는다" 라는 문제는 저희 개발자들이 해결해야할 문제입니다.

이 때, 문제를 해결하는 여러 방법들 중 한 방법이 낙관적/비관적 Lock 이며, 저희는 이 Lock 을 사용해서 동시성을 제어해야 합니다.

더 나아가서, 트랜잭션 격리 수준을 통해 읽기 일관성을 지켜주게 하는 것은 DBMS가 지원하는 것이라 소개했습니다.

그렇기 때문에 아래 2가지가 중요하다고 생각합니다.

각 DBMS마다 데이터의 일관성을 유지하기 위해 default로 설정된 격리 수준이 다르기 때문에 사용할 DBMS 의 default 격리 수준은 무엇인지 아는 것
각 DBMS마다 다양한 문제들(Lost Update, Phantom read) 를 해결하는(동시성을 제어하는 방식)이 다르기 때문에 어떻게 데이터의 일관성을 유지하고 있는지 아는 것

출처

Code Squad 의 Lucas '트랜잭션' 학습 자료
Youtube '쉬운 코드' 의 DB 강의 자료
Real MySQL 8.0

저작자표시 (새창열림)

'MySQL' 카테고리의 다른 글

'실행계획에서 무엇을 중요하게 볼 것인가?' - 개인적인 의견 (0)	2025.01.11
MySQL 은 읽기/쓰기 쿼리에서 어떤 락을 사용할까? (2)	2025.01.04
MySQL 8.0의 B-Tree 인덱스 알아보기 (2)	2024.10.07

It`s all your duck🍀

[동시성 제어] 트랜잭션 격리 수준과 낙관적/비관적 락의 필요성

1. 트랜잭션의 격리 수준(Isolation level) 이해하기

트랜잭션의 격리 수준(isolation)이란?

2. 트랜잭션의 격리 수준 4단계와 이에 따라 발생하는 문제 3가지

문제 1. Dirty Read Problem

문제 2. Non-repeatable Read Problem

문제 3. Phantom Read Problem

격리 수준 1단계 : Read Uncommitted

격리 수준 2단계 : Read committed

격리 수준 3단계 : Repeatable Read

격리 수준 4단계 : Serializable

3. 트랜잭션 격리 수준과 "Lock" 의 관계

4. MVCC(Mulit Version Concurrency Control) 의 등장

MVCC 란?

5. MySQL 의 MVCC와 낙관적, 비관적 락의 관계

'MySQL' 카테고리의 다른 글

티스토리툴바

[동시성 제어] 트랜잭션 격리 수준과 낙관적/비관적 락의 필요성

1. 트랜잭션의 격리 수준(Isolation level) 이해하기

트랜잭션의 격리 수준(isolation)이란?

2. 트랜잭션의 격리 수준 4단계와 이에 따라 발생하는 문제 3가지

문제 1. Dirty Read Problem

문제 2. Non-repeatable Read Problem

문제 3. Phantom Read Problem

격리 수준 1단계 : Read Uncommitted

격리 수준 2단계 : Read committed

격리 수준 3단계 : Repeatable Read

격리 수준 4단계 : Serializable

3. 트랜잭션 격리 수준과 "Lock" 의 관계

4. MVCC(Mulit Version Concurrency Control) 의 등장

MVCC 란?

5. MySQL 의 MVCC와 낙관적, 비관적 락의 관계

'MySQL' 카테고리의 다른 글

'MySQL' Related Articles

티스토리툴바