본문 바로가기
CS/Algorithm

[알고리즘 개념 정리] 다익스트라 최단 경로 알고리즘 (Python)

by 랄라J 2024. 3. 28.

[이것이 코딩 테스트다 with Python] 30강 다익스트라 최단 경로 알고리즘을 듣고 정리한 내용입니다.

 

최단 경로 알고리즘

- 가장 짧은 경로를 찾는 알고리즘을 의미한다.

- 다양한 문제 상황

    1. 한 지점에서 다른 한 지점까지의 최단 경로

    2. 한 지점에서 다른 모든 지점까지의 최단 경로

    3. 모든 지점에서 다른 모든 지점까지의 최단 경로

- 각 지점은 그래프에서 노드로 표현한다.

- 지점 간 연결된 도로는 그래프에서 간선으로 표현한다.

 

 

다익스트라 최단 경로 알고리즘

- 특정한 노드에서 출발하여 다른 모든 노드로 가는 최단 경로를 계산한다.

- 다익스트라 최단 경로 알고리즘은 음의 간선이 없을 때 정상적으로 동작한다.

    - 현실 세계의 도로(간선)는 음의 간선으로 표현되지 않는다.

- 다익스트라 최단 경로 알고리즘은 그리디 알고리즘으로 분류된다.

    - 매 상황에서 가장 비용이 적은 노드를 선택해 임의의 과정을 반복한다.

 

다익스트라 알고리즘의 특징

- 그리디 알고리즘 : 매 상황에서 방문하지 않은 가장 비용이 적은 노드를 선택해 임의의 과정을 반복한다.

- 단계를 거치며 한 번 처리된 노드의 최단 거리는 고정되어 더 이상 바뀌지 않는다.

    - 한 단계당 하나의 노드에 대한 최단 거리를 확실히 찾는 것으로 이해할 수 있다.

- 다익스트라 알고리짐을 수행한 뒤에 테이블에 각 노드까지의 최단 거리 정보가 저장된다.

    - 완벽한 형태의 최단 경로를 구하려면 소스코드에 추가적인 기능을 더 넣어야 한다.

 

다익스트라 최단 경로 알고리즘 동작과정

알고리즘 동작 과정에서 최단 거리 테이블은 각 노드에 대한 현재까지의 최단 거리 정보를 가지고 있다.

처리 과정에서 더 짧은 경로를 찾으면 이제부터는 이 경로가 제일 짧은 경로야 라고 갱신한다.

 

1. 출발 노드를 설정한다

2. 최단 거리 테이블을 초기화한다. (자기 자신은 0으로, 나머지는 무한으로)

3. 방문하지 않은 노드중에서 최단 거리가 가장 짧은 노드를 선택한다.

4. 해당 노드를 거쳐 다른 노드로 가능 비용을 계산하여 최단 거리 테이블을 갱신한다.

5. 위 과정에서 3, 4번을 반복한다.

 

다익스트라 최단 경로 알고리즘 동작과정

단계마다 방문하지 않은 노드 중 최단 거리가 가장 짧은 노드를 선택하기 위해 매 단계마다 1차원 테이블의 모든 원소를 확인한다.

import sys
input = sys.stdin.readline

# 무한을 의미하는 값으로 10억 설정
INF = 1e9

# 노드의 개수, 간선의 개수를 입력받기
n, m = map(int, input().split())

# 시작 노드 번호 입력받기
s = int(input())

# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for _ in range(n + 1)]
# 방문한 적이 있는지 체크하는 목적의 리스트 만들기
visited = [False] * (n + 1)
# 최단거리 테이블을 무한으로 초기화
distance = [INF] * (n + 1)

# 모든 간선 정보 입력받기
for _ in range(m):
    a, b, c = map(int, input().split())
    # a번 노드에서 b번 노드로 가는 비용이 c
    graph[a].append((b, c))

# 방문하지 않은 노드 중, 가장 최단 거리가 짧은 노드의 번호 반환
def get_smallest_node():
    min_value = INF
    idx = 0
    for i in range(1, n + 1):
        if distance[i] < min_value and not visited[i]:
            min_value = distance[i]
            idx = i
        return idx

def dijkstra(start):
    # 시작 노드 초기화
    distance[start] = 0
    visited[start] = True
    for j in graph[s]:
        distance[j[0]] = j[1]

    # 시작 노드를 제외한 전체 n - 1개의 노드에 대해 반복
    for i in range(n - 1):
        # 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
        now = get_smallest_node()
        visited[now] = True

        # 현재 노드와 연결된 다른 노드를 확인
        for j in graph[now]:
            cost = distance[now] + j[1]
            # 현재 노드를 거쳐 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost < distance[j[0]]:
                distance[j[0]] = cost

# 다익스트라 알고리즘 수행                
dijkstra(s)

# 모든 노드로 가기 위한 최단 거리 출력
for i in range(1, n + 1):
    # 도달할 수 없는 경우, 무한이라고 출력
    if distance[i] == INF:
        print("INF")
    else:
        print(distance[i])

 

단, 위와 같이 코드를 구현한다면 성능은 아래와 같다.

- 총 O(V)번에 걸쳐 최단 거리가 가장 짧은 노드를 매번 선형 탐색해야 함 -> 전체 시간 복잡도는 O(V²)

- 일반적으로 코딩 테스트의 최단 경로 문제에 전체 노드 개수가 5천개 이하면 위 코드로 문제를 해결할 수 있지만 그 외는 시간초과가 날 수 있음

 

우선순위 큐

- 우선순위가 가장 높은 데이터를 가장 먼저 삭제하는 자료구조

 

- 우선순위 큐를 구현하기 위해 사용하는 자료구조 중 하나

- 최소 힙과 최대 힙이 있다.

- 삽입 시간 O(logN), 삭제 시간 O(logN)

 

최소 힙

import heapq

# 오름차순 힙 정렬(Heap Sort)
def heapsort(iterable):
    h = []
    result = []
    # 모든 원소를 차례대로 힙에 삽입
    for value in iterable:
    	heapq.heappush(h, value)
    for i in range(len(h)):
    	result.append(heapq.heappop(h))
    return result
    
result = heapsort([1,3,5,7,9,2,4,6,8,0])
print(result)

# 실행결과
# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

참고, 파이썬의 heap은 최소힙으로 구현되어있다.

 

최대 힙

import heapq

# 내림차순 힙 정렬(Heap Sort)
def heapsort(iterable):
    h = []
    result = []
    # 모든 원소를 차례대로 힙에 삽입
    for value in iterable:
    	heapq.heappush(h, -value)
    for i in range(len(h)):
    	result.append(-heapq.heappop(h))
    return result
    
result = heapsort([1,3,5,7,9,2,4,6,8,0])
print(result)

# 실행결과
# [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

따라서, 최대 힙을 구현할 때는 부호를 바꿔서 넣고, 부호를 바꿔서 꺼내야 한다.

 

다익스트라 알고리즘 힙을 사용한 개선된 구현 방법

- 단계마다 방문하지 않은 노드 중 최단거리가 가장 짧은 노드를 선택하기 위해 Heap 자료구조를 이용한다.

- 다익스트라 알고리즘이 동작하는 기본 원리는 동일하나 현재 가장 가까운 노드를 저장해 놓기 위해 힙 자료구조를 추가적으로 이용한다는 점이 다르다. 현재의 최단 거리가 가장 짧은 노드를 선택해야하므로 최소 힙을 사용한다.

 

import heapq
import sys
input = sys.stdin.readline
INF = 1e9 # 무한을 의미하는 값으로 10억 설정

# 노드의 개수, 간선의 개수를 입력받기
n, m = map(int, input().split())

# 시작 노드 번호 입력받기
s = int(input())

# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for _ in range(n + 1)]
# 방문한 적이 있는지 체크하는 목적의 리스트 만들기
visited = [False] * (n + 1)
# 최단거리 테이블을 무한으로 초기화
distance = [INF] * (n + 1)

# 모든 간선 정보 입력받기
for _ in range(m):
    a, b, c = map(int, input().split())
    # a번 노드에서 b번 노드로 가는 비용이 c
    graph[a].append((b, c))

def dijkstra(start):
    q = []
    # 시작 노드로 가기 위한 최단 경로는 0으로 설정하여 큐에 삽입
    heapq.heappush(q, (0, start))
    distance[start] = 0

    # queue가 비어있지 않다면
    while q:
        # 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
        dist, now = heapq.heappop(q)
        
        # 현재 노드가 이미 처리된 적이 있는 노드라면 무시
        if distance[now] < dist:
            continue
            
        # 현재 노드와 연결된 다른 인접한 노드들을 확인
        for i in graph[now]:
            cost = i + dist
            # 현재 노드를 거쳐, 다른 노드로 이동하는 거리가 더 짧은 경우
            if cost < distance[i[0]]:
                distance[i[0]] = cost
                heapq.heappush(1, (cost, i[0]))

# 다익스트라 알고리즘 수행                
dijkstra(s)

# 모든 노드로 가기 위한 최단 거리 출력
for i in range(1, n + 1):
    # 도달할 수 없는 경우, 무한이라고 출력
    if distance[i] == INF:
        print("INF")
    else:
        print(distance[i])

 

위와 같이 힙을 사용해 코드를 구현한다면 시간 복잡도는 O(ElogV)이다.

노드를 하나씩 꺼내 검사하는 반복문은 노드의 개수 V 이상의 횟수로는 처리되지 않는다.

결과적으로 현재 우선순위 큐에서 꺼낸 노드와 연결된 다른 노드들을 확인하는 총 횟수는 최대 간선의 개수만큼 연산이 수행될 수 있다.

 

반응형

댓글