1. 인덱스 구조 및 탐색

미리보는 인덱스 튜닝

데이터를 찾는 두가지 방법

테이블 전체를 스캔한다.
인덱스를 이용한다.

이중 인덱스는 큰 테이블에서 소량 데이터를 검색할 때 사용한다. 테이블 전체 스캔하는 것에 대해서는 튜닝할 요소가 많지 않지만, 인덱스 튜닝에 대해서는 튜닝 요소가 많고 기법도 많다.

인덱스 튜닝의 두 가지 핵심요소

인덱스 스캔 효율화 튜닝: 인덱스 스캔 자체를 효율적으로 하는 것이다. 스캔의 범위를 줄인다.
- 이름이 홍길동이면서 시력이 1.0 ~ 1.5인 데이터를 찾는다고 가정해보자. 이름 + 시력의 순서로 인덱스를 구성하는 것이 좋을까, 시력 + 이름으로 인덱스를 구성하는 것이 좋을까? 전자로 구성을 한다면 홍길동인 사람을 찾고 그 범위내에서 시력조건에 맞는 사람을 바로 찾을 수 있다. 하지만 후자로 구성을 한다면 1.0인사람 1.1인사람 별로 정렬이 되어있기에 1.0 ~ 1.5인 데이터를 전부 조회해 홍길동을 찾아야 한다. 스캔의 범위가 더 늘어 난다.
랜덤 액세스 최소화 튜닝: 랜덤 I/O를 최소화 할 수 있는 인덱스를 구성한다.
- 인덱싱을 해서 테이블을 뒤질 값을 5개 얻어낸 것과 100개를 얻어낸 것은 다르다. 전자는 랜덤 I/O를 5번만 수행하면 됐지만, 후자는 랜덤 I/O를 100회 수행해야 한다.

SQL 튜닝은 랜덤 I/O와의 전쟁이다.

DBMS의 많은 기능이 느린 랜덤 I/O를 극복하기 위해 개발됐다.

인덱스 구조

인덱스는 책의 색인과 같다. 인덱스가 없다면 원하는 정보를 찾을 때 책을 처음부터 끝까지 전부 뒤져야한다. 하지만 인덱스를 사용하면 원하는 곳부터 읽고 중간에 멈출 수 있다. 이것이 가능한 이유는 인덱스는 정렬되어 관리되기 때문이다.

DBMS는 일반적으로 B-Tree 인덱스를 사용한다. Root 부터 Branch를 거쳐 Leaf 노드에서 값을 찾는다. 루트와 브랜치의 각 레코드는 하위 블록에 대한 주소값을 가지고 있다. A값을 가지고있다면 왼쪽 리프에는 A보다 작은 값이, 오른쪽 리프에는 A보자 큰 값이 있다는 뜻이다.

LMC(Leftmost Child): 자식 노드 중 가장 왼쪽 끝에 위치한 블록을 가리킨다. 루트와 브랜치 블록에 있다.
ROWID: 테이블 레코드를 가리키는 주소 값. (데이터 블록 주소 + 로우 번호)

인덱스 탐색과정은 수직적 탐색과 수평적 탐색으로 나눌 수 있다.

인덱스 수직적 탐색 (인덱스 스캔 시작점을 찾는 과정)

루트 노드부터 조건을 만족하는 첫 번째 인덱스를 찾아가는 과정.

탐색 과정에서 찾고자하는 값보다 크거나 같은 값을 만나면 바로 직전 레코드가 가리키는 하위 블록으로 이동한다. 직전 레코드 값이 가리키는 블럭으로 이동해야 레코드를 빠뜨리지 않는다는 사실을 명심해야한다.