데이터베이스 인덱스 활용

Programing Language/SQL

Data-SSung 2025. 6. 15. 17:19

인덱스 활용은 데이터베이스가 쿼리를 실행할 때 인덱스를 사용해서 데이터를 빠르게 찾는 것을 말해요.

인덱스란?

인덱스는 책의 목차나 색인처럼 데이터의 위치를 미리 정리해둔 구조예요. 테이블의 특정 컬럼 값들을 정렬해서 저장하고, 각 값이 실제 테이블의 어느 행에 있는지 포인터를 가지고 있어요.

추가로 기억할 점:

인덱스를 탈 수 있는 경우:

sql

-- 인덱스 활용 가능 (Index Seek)
WHERE age > 25
WHERE salary < 50000
WHERE created_date >= '2024-01-01'

인덱스를 못 타는 경우:

sql

-- 인덱스 활용 불가 (Full Table Scan)
WHERE YEAR(created_date) = 2024
WHERE UPPER(name) = 'JOHN'
WHERE age + 10 > 35

예를 들어 100만 건 데이터에서:

그래서 WHERE절에서는 컬럼을 가공하지 않고 원본 그대로 비교 연산자를 사용하는 게 성능상 유리해요.

데이터 양이 늘어날 때 처리 시간이 얼마나 증가하는지를 나타내는 지표예요.

인덱스 사용 시 (O(log n)):

풀 테이블 스캔 시 (O(n)):

인덱스는 이진 탐색(Binary Search) 방식으로 동작해요:

정렬된 인덱스: [1, 5, 10, 15, 20, 25, 30, 35, 40]
WHERE age > 25 를 찾을 때:

1단계: 중간값 20 확인 → 25보다 작음 → 오른쪽으로
2단계: 중간값 35 확인 → 25보다 큼 → 왼쪽으로  
3단계: 25 발견!

반면 함수를 쓰면 모든 행을 하나씩 확인해야 해요:

sql

WHERE YEAR(created_date) = 2024
-- 각 행마다 YEAR() 함수 실행 후 비교

그래서 데이터가 많을수록 인덱스 활용의 성능 차이가 기하급수적으로 커져요.