동적 계획법(Dynamic Programming, DP)

동적 계획법이란?

동적 계획법(DP, 다이내믹 프로그래밍)은 기본적인 아이디어로 하나의 큰 문제를 여러 개의 작은 문제로 나누어서 그 결과를 저장하여 다시 큰 문제를 해결할 때 사용하는 것으로 특정한 알고리즘이 아닌 하나의 문제해결 패러다임으로 볼 수 있다. 큰 문제를 작은 문제로 쪼개서 그 답을 저장해 두고 재활용한다가 핵심이다.

동적 계획법 사용 이유

일반적인 재귀(Native Recursion) 방식 또한 DP와 매우 유사하다. 큰 차이점은 일반적인 재귀를 단순히 사용 시 동일한 작은 문제들이 여러 번 반복되어 비효율적인 계산이 될 수 있다는 것이다.

예를 들어 피보나치 수열을 살펴보자. 피보나치수열은 아래와 같다.

1, 1, 2, 3, 5, 6, 13, 21, 34, 55, 89, 144...

피보나치 수를 구하고 싶을 때 재귀로 함수를 구성하면 어떻게 될까 단순하다. return f(n) = f(n - 1) + f(n - 2)

그런데 f(n - 1), f(n - 2)에서 각 함수를 1번씩 호출하면 동일한 값을 2번씩 구하게 되고 이로 인해 100번째 피보나치 수를 구하기 위해 호출되는 함수의 횟수는 기하급수적으로 증가한다. 왜냐하면 f(n - 1)에서 한 번 구한 값을 f(n - 2)에서 또다시 같은 값을 구하는 과정을 반복하게 되기 때문이다. 아래의 그림처럼 반복되는 계산을 또 하게 된다.

그러나 한 번 구한 작은 문제의 결과 값을 저장해 두고 재사용한다면 어떨까? 앞에서 계산된 값을 다시 반복할 필요가 없이 약 200회 내에서 계산이 가능해진다. 즉, 매우 효율적으로 문제를 해결할 수 있게 된다. 시간복잡도를 기준으로 아래와 같이 개선이 가능하다. O(n^2) -> O(f(n))으로 개선

동적 계획법의 사용 조건

동적 계획법 DP가 적용되기 위해서는 2가지 조건을 만족해야 한다.

Overlapping Subproblems (겹치는 부분 문제)

Optimal Substructure (최적 부분 구조)

Overlapping Subproblems

DP는 기본적으로 문제를 나누고 그 문제의 결과 값을 재활용해서 전체 답을 구한다. 그래서 동일한 작은 문제들이 반복하여 나타나는 경우에 사용이 가능하다.

즉, DP는 부분 문제의 결과를 저장하여 재 계산하지 않을 수 있어야 하는데, 해당 부분 문제가 반복적으로 나타나지 않는다면 재사용이 불가능하니 부분 문제가 중복되지 않는 경우에는 사용할 수 없다.

예를 들어, 이진 탐색과 피보나치 수열의 경우를 비교해 보자.

이진 탐색은 특정 데이터를 정렬된 배열 내에서 그 위치를 찾기 때문에 그 위치를 찾은 후 바로 반환할 뿐 그것을 재사용하는 과정을 거치지 않는다. 반면, 피보나치 수열은 f(n) = f(n - 1) + f(n - 2)인데, 아래와 같은 트리 구조로 함수를 호출하게 된다.

위에서 보면 f(3), f(2), f(1)과 같이 동일한 부분 문제가 중복되어 나타난다. 그러므로 우리는 1회 계산했을 때, 저장된 값을 재활용할 수 있게 되는 것이다.

Optimal Substructure(최적 부분 구조)

부분 문제의 최적 결과 값을 사용해 전체 문제의 최적 결과를 낼 수 있는 경우를 의미한다. 그래서 특정 문제의 정답은 문제의 크기에 상관없이 항상 동일하다.

만약, A - B까지의 가장 짧은 경로를 찾고자 하는 경우를 예시로 할 때, 중간에 X가 있을 때, A - X / X - B가 많은 경로 중 가장 짧은 경로라면 전체 최적 경로도 A - X - B가 정답이 된다.

위의 그림에서 A - X사이의 최단 거리는 AX2이고 X - B는 BX2이다. 전체 최단 경로는 AX2 - BX2이다. 다른 경로를 택한다고 해서 전체 최단 경로가 변할 수는 없다.

이와 같이, 부분 문제에서 구한 최적 결과가 전체 문제에서도 동일하게 적용되어 결과가 변하지 않을 때 DP를 사용할 수 있게 된다. 피보나치 수열도 동일하게 이전의 계산 값을 그대로 사용하여 전체 답을 구할 수 있어 최적 부분 구조를 갖고 있다.

동적 계획법 사용하기

동적 계획법은 특정한 경우에 사용하는 알고리즘이 아니라 하나의 방법론이므로 다양한 문제해결에 쓰일 수 있다. 그래서 동적 계획법을 적용할 수 있는 문제인지를 알아내는 것부터 코드를 짜는 과정이 난이도가 쉬운 것부터 어려운 것까지 다양하다.

일반적으로 아래와 같은 과정을 거쳐 진행된다.

동적 계획법으로 풀 수 있는 문제인지 확인한다.
문제의 변수 파악
변수 간 관계식 만들기(점화식)
메모하기(memoization or tabulation)
기저 상태 파악하기
구현하기

동적 계획법으로 풀 수 있는 문제인지 확인

애초에 이 부분부터 해결이 매우 어렵다. 우선 동적 계획법의 조건 부분에서 써 내렸듯이, 현재 직면한 문제가 작은 문제들로 이루어진 하나의 함수로 표현될 수 있는지를 판단해야 한다.

즉, 위에서 쓴 조건들이 충족되는 문제인지를 한 번 체크해 보는 것이 좋다.

보통 특정 데이터 내 최대화/최소화 계산을 하거나 특정 조건 내 데이터를 세야 한다거나 확률 등의 계산의 경우 동적 계획법으로 풀 수 있는 경우가 많다.

문제의 변수 파악

동적 계획법은 현재 변수에 따라 그 결과 값을 찾고 그것을 전달하여 재사용하는 것을 거친다. 즉, 문제 내 변수의 개수를 알아내야 한다는 것이다. 예를 들어, 피보나치 수열에서는 n번째 숫자를 구하는 것이므로 n이 변수가 된다. 그 변수가 얼마이냐에 따라 결괏값은 다르지만 그 결과를 재사용하고 있다.

유명한 Knapsack 문제에서는 index, 무게로 2가지의 변수를 사용한다. 이와 같은 해당 문제에서 어떤 변수가 있는지를 파악해야 그에 따른 답을 구할 수 있다.

변수 간 관계식 만들기

변수들에 의해 결과 값이 달라지지만 동일한 변숫값인 경우 결과는 동일하다. 또한 우리는 그 결과 값을 그대로 이용할 것이므로 그 관계식을 만들어낼 수 있어야 한다.

그러한 식을 점화식이라고 부르며 그를 통해 짧은 코드 내에서 반복/. 재귀를 통해 문제가 자동으로 해결되도록 구축할 수 있게 된다.

예를 들어 피보나치 수열에서는 f(n) = f(n-1) + f(n-2)가 점화식이 된다.

메모하기

변수 간 관계식까지 정상적으로 생성되었다면 변수의 값에 따른 결과를 저장해야 한다. 이것을 메모한다고 하여 Memoization이라고 부른다. 변수 값에 따른 결과를 저장할 배열 등을 미리 만들고 그 결과를 나올 때마다 배열 내에 저장하고 그 저장된 값을 재사용하는 방식으로 문제를 해결해 나간다. 이 결과 값을 저장할 때는 보통 배열을 쓰며 변수의 개수에 따라 배열의 차원이 1-3차원 등 다양할 수 있다.

기저 상태 파악하기

여기까지 진행했으면, 가장 작은 문제의 상태를 알아야 한다. 보통 몇 가지 예시를 직접 손으로 테스트하여 구성하는 경우가 많다. 피보나치 수열을 예시로 들면, f(0) = 0, f(1) = 1과 같은 방식이다. 이후 두 가지 숫자를 더해가며 값을 구하지만 가장 작은 문제는 저 2개로 볼 수 있다.

해당 기저 문제에 대해 파악 후 미리 배열 등에 저장해 두면 된다.

구현하기

Bottom-Up 방식
이름에서 보이듯이, 아래에서부터 계산을 수행하고 누적시켜서 전체 큰 문제를 해결하는 방식이다. 메모를 위해서 dp라는 배열을 만들었고 이것을 1차원이라 가정했을 때, dp[0]이 기정 상태이고 dp[n]을 목표 상태라고 하자. Bottom-up은 dp[0]부터 시작하면 반복문을 통해 점화식으로 결과를 내서 dp[n]까지 그 값을 전이시켜 재활용하는 방식이다.

왜 Tabulation? 사실 위에서 메모하기 부분에서 Memoization이라 했는데 bottom-up일 때는 Tabulation이라고 부른다. 왜냐면 반복을 통해 dp[0]부터 하나하나씩 채우는 과정을 "table filling"이라고 하며, 이 Table에 저장된 값에 직접 접근하여 재활용하므로 Tablulation이라는 명칭이 부었다고 한다.

Top-Down 방식
dp[0]의 기저에서 출발하는 대신 dp[n]의 값을 찾기 위해 위에서부터 바로 호출을 시작하여 dp[0]의 상태까지 내려간 다음 해당 결과 값을 재귀를 통해 전이시켜 재활용하는 방식이다. 피보나치의 예시처럼 f(n) = f(-2) + f(n-1)의 과정에서 함수 호출 트리의 과정에서 보이듯, n = 5일 때 f(3), f(2)의 동일한 계산이 반복적으로 나오게 된다. 이때, 이미 이전에 계산을 완료한 경우에는 단순히 메모리에 저장되어 있던 내역을 꺼내서 활용하면 된다. 그래서 가장 최근의 상태 값을 메모해 두었다고 하여 Memoization이라고 부른다.

출처

알고리즘 - Dynamic Programming(동적 계획법)

1. 개요 DP, 즉 다이나믹 프로그래밍(또는 동적 계획법)은 기본적인 아이디어로 하나의 큰 문제를 여러 개의 작은 문제로 나누어서 그 결과를 저장하여 다시 큰 문제를 해결할 때 사용하는 것으로

hongjw1938.tistory.com

저작자표시 비영리 변경금지 (새창열림)

'프로그래밍 > Algorithm' 카테고리의 다른 글

[프로그래머스 Programmers] 하노이의 탑 (1)	2023.09.07
[프로그래머스 Programmers] 분수의 덧셈 (2)	2023.09.06
[프로그래머스 Programmers] 거스름돈 (0)	2023.09.01
깊이 우선 탐색(Depth-first search, DFS) (1)	2023.08.30
스택(Stack) 자료구조 (1)	2023.08.30

반토막의 자유일지

동적 계획법(Dynamic Programming, DP)

동적 계획법이란?

동적 계획법 사용 이유