Home 트랜잭션
Post
Cancel

트랜잭션

트랜잭션

데이터베이스에 하나의 논리적 기능을 수행하기 위한 작업의 단위를 말한다.

데이터베이스에 접근하는 방법은 쿼리이므로, 즉 여러개의 쿼리들을 하나로 묶는 단위를 말한다.

커밋과 롤백

커밋은 여러 쿼리가 성공적으로 처리되었다고 확정하는 명령어이다. 트랜잭션 단위로 수행되며 변경된 내용이 모두 영구적으로 저장되는 것을 말한다.

커밋이 수행되었다를 하나의 트랜잭션이 성공적으로 수행되었다라고 말할 수 있다.

하지만 에러나 여러 이슈때문에 트랜잭션 전으로 돌려야 하는 상황이라면?

이 때 사용하는 것이 롤백이다. 롤백이란 트랜잭션으로 처리한 하나의 묶음 과정을 일어나기 전으로 돌리는 일을 말한다.

이러한 커밋과 롤백 덕분에 데이터의 무결성이 보장된다. 또한 데이터 변경 전에 변경 사항을 쉽게 확인할 수 있고 해당 작업을 그룹화할 수 있다.

이때문에 롤백을 생각해 트랜잭션으로 묶는 로직에 외부 API 호출은 자제해야 한다.

트랜잭션 전파

트랜잭션을 수행할 때 커넥션 단위(ex - DB에 연결)로 수행하기 때문에 커넥션 객체를 넘겨 수행해야 한다. 하지만 이를 매번 넘겨주기도 어렵고 귀찮다.

이를 넘겨서 수행하지 않고 여러 트랜잭션 관련 메서드의 호출을 하나의 트랜잭션에 묶이도록 하는 것을 트랜잭션 전파라고 한다.

Spring 에서는 @Transactional 애너테이션을 통해 여러 쿼리 관련 코드들을 하나의 트랜잭션으로 처리하기도 한다.

1
2
3
4
5
6
7
8
@Service
@Transactional(readOnliy = true)
public class MemberService{
	private final MemberRepository memberRepository;
	
	public MemberService(MemberRepository memberRepository){
		this.memberRepository = memberRepository;
	}

트랜잭션의 특징 (ACID)

원자성 (atomicity)

트랜잭션과 관련된 일이 모두 수행되었거나 모두 수행되지 않았거나를 보장하는 특징이다.

트랜잭션을 커밋했는데, 문제가 발생하여 롤백하는 경우 그 이후에 모두 수행되지 않음을 보장한다.

예를 들어 1000만원을 가진 홍철이가 0원을 가진 규영이에게 500만원을 이체한다고 가정하자. 그렇다면 결과로는 홍철 500만원 규영 500만원이다.

  1. 홍철의 잔고를 조회한다.
  2. 홍철에게서 500만원을 뺀다.
  3. 규영에세 500만원을 넣는다.

이러한 과정 중 데이터베이스 사용자는 이 세가지의 과정을 볼 수도 참여할 수도 없다. 다만 이 과정이 모두 끝난 이후의 상황인 결과만 본다.

여기서 이러한 작업을 취소한다고 했을 때 홍철이는 다시 1000만원, 규영이는 0원을 가져한다. 일부 operation만 적용된 홍철 500만원, 규영 0원이 되지 않는다.

일관성(consistency)

허용된 방식으로만 데이터를 변경해야 하는 것을 의미한다.

데이터베이스에 기록된 모든 데이터는 여러가지 조건, 규칙에 따라 유효함을 가져야 한다.

예를 들어 홍철 1000만원, 규영 0원인 상태에서 규영이가 홍철이한테 500만원을 보내는 것은 불가능하다. (마이너스 통장 등으로 조건을 걸어 가능하게 할 수도 있다. 어쨌든 조건이나 규칙에 따라 데이터를 변경해야 하는 것을 의미하는 것이다.)

격리성(isolation)

트랜잭션 수행 시 서로 끼어들지 못하는 것을 말한다. 복수의 병렬 트랜잭션은 서로 격리되어 마치 순차적으로 실행되는 것처럼 작동되어야 하고, 데이터베이스는 여러 사용자가 같은 데이터에 접근할 수 있어야한다.

지속성(durability)

성공적으로 수행된 트랜잭션은 영원히 반영되어야 하는 것을 의미한다.

이는 데이터베이스에 시스템 장애가 발생해도 원래 상태로 복구하는 회복기능이 있어야 함을 뜻하며, 데이터베이스는 이를 위해 체크섬, 저널링, 롤백 등의 기능을 제공한다.

저널링

파일 시스템 또는 데이터베이스 시스템에 변경 사항을 반영(commit)하기 전에 로깅하는 것, 트랜잭션 등 변경 사항에 대한 로그를 남기는 것. 즉 로깅.

무결성

무결성이란 데이터의 정확성, 일관성, 유효성을 유지하는 것을 말하며, 무결성이 유지되어야 데이터베이스에 저장된 데이터 값과 그 값에 해당하는 현실 세계의 실제 값이 일치하는 지에 대한 신뢰가 생긴다.

  • 개체 무결성 : 기본키로 선택된 필드는 빈 값을 허용하지 않는다.
  • 참조 무결성 : 서로 참조 관계에 있는 두 테이블의 데이터는 항상 일관된 값을 유지해야 한다.
  • 고유 무결성 : 특정 속성에 대해 고유한 값을 가지도록 조건이 주어진 경우 그 속성 값은 모두 고유한 값을 가진다.
  • NULL 무결성 : 특정 속성값에 NULL이 올 수 없다는 조건이 주어진 경우 그 속성 값은 NULL이 될 수 없다는 제약 조건이다.

트랜잭션의 격리성에 대해.

격리성은 트랜잭션끼리 서로 간섭을 못하는 것을 의미한다.

순차적으로 수행하면 당연히 간섭을 못한다. 하지만 하나하나 순차적으로 수행하면 동시에 수행했을 때보다 효율이 떨어지게 된다.

격리성을 높이면 원하는 대로 결과가 나타나지만 동시성(성능)이 낮아지는 문제가 발생할 수 있다.

반대로 격리성을 낮추고 동시성을 높이면 성능이 올라가지만 간섭이 생겨 의도하지 않은 결과가 나타날 수 있다.

이러한 정도를 조절하기 위해 격리성은 단계가 있다.

격리성의 단계

격리성은 여러가지 단계가 있고 해당 단계에 따라 격리성과 동시성의 정도가 달라지게 된다. 이러한 단계들은 DB에서 조정할 수 있다.

MySQL의 경우 아래의 명령어로 그 단계를 조절할 수 있다.

1
set session transaction isolation level read uncommitted;

Serializable은 격리성이 가장 높은 단계이고 팬텀 리드같은 이상현상이 발생하지 않는다.

반대로 Read_uncommitted의 경우 팬텀리드, 반복가능하지 않은 조회, 더티리드의 이상현상이 발생할 수 있다.

트랜잭션의 격리수준에 따른 현상

팬텀리드(phantom reads)

한 트랜잭션 내에서 동일한 쿼리를 2번 이상 보냈을 때 해당 조회 결과가 다른 것을 의미한다.

위의 그림에선 size가 +1이 된 결과를 받아 첫 번째 결과와 다르게 된다.

반복 가능하지 않은 조회(Nonrepeatable reads)

한 트랜잭션 내의 같은 행에 두 번 이상 조회가 발생했는데, 그 값이 다른 것을 의미한다.

팬텀리드와 비슷하지만 팬텀리드가 더 넓은 의미를 가지고 있다.

팬텀리드는 한 쿼리내의 이야기이고, 반복 가능하지 않은 조회는 한 행에서의 조회를 말한다.

더티 리드(Dirty reads)

하나의 트랜잭션이 다른 트랜잭션의 아직 커밋되지 않은 데이터를 읽는 현상이다.

T1이 업데이트 이후 롤백을 하여 커밋되지 않은 데이터가 됐음에도 불구하고 T2는 이미 커밋이 되었다 라고 판단하게 되는 것이다.

트랜잭션의 격리 수준

Serializable

커밋 완료된 데이터에 대해서만 조회할 수 있으며 트랜잭션을 순차적으로 진행시키는 것이다. 여러 트랜잭션이 동시에 같은 행에 접근할 수 없다.

Repeatable_read

커밋 완료된 데이터에 대해서만 조회할 수 있으며 반복해서 행을 조회하더라도 똑같은 행을 보장하는 단계이다. 하나의 트랜잭션이 수정한 행을 다른 트랜잭션이 수정할 수 없도록 막아주지만 새로운 행을 추가하는 것을 막지는 않는다.

따라서 똑같은 범위 쿼리를 실행했을 때 추가된 행이 발견될 수 있고 이에 따라 팬텀리드가 발생할 수 있는 것이다.

MySQL의 기본 설정이다.

Read_commited

커밋 완료된 데이터에 대해서만 조회할 수 있으며 커밋이 되지 않은 정보는 읽지 못한다.

팬텀리드반복 가능하지 않은 조회가 일어날 수 있다.

PostgreSQL, SQL Server, 오라클에서 기본값으로 설정되어 있다. 가장 많이 사용되는 격리 수준이다.

Read_uncommited

가장 낮은 격리 수준이며 가장 빠르다. 다른 트랜잭션이 커밋하지 않은 정보를 읽을 수 있다.

MongoDB의 기본값이다.

This post is licensed under CC BY 4.0 by the author.