Post

최장 공통 부분 문자열 알고리즘 [Longest Common Substring]

최장 공통 부분 문자열 알고리즘 [Longest Common Substring]

Longest Common Substring



Link
백준 5582번 공통 부분 문자열

image


공통 부분 수열과의 차이점은 문자열은 연속되어야 한다는 점임.

따라서 달라져야 하는 부분은 공통 수열에서는 arr[i] != arr[j] 일 때, 이전까지 구한 부분수열 길이의 최대값을 가져왔지만, 부분 문자열에서는 같지 않을 때, dp[i][j]=0이 되어야 함.

같을 때는 부분 수열과 동일하게 이전까지 구한 부분 문자열에 현재 문자를 추가해줘야 함.

따라서 아래와 같이 점화식이 구성이 됨.


1
2
3
arr[i] == arr[j] => dp[i][j]=dp[i-1][j-1]+1

arr[i] != arr[j] => dp[i][j]=0


문제 코드는 아래와 같음.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
#include <iostream>
#include <algorithm>
#include <string>
using namespace std;

int dp[4001][4001];

int main()
{
  string s1, s2; cin >> s1 >> s2;
  int i=0, j=0, res=-1;
  
  for(; i<s1.size(); i++)
  {
      for(j=0; j<s2.size(); j++)
      {
          if(s1[i] == s2[j]) { dp[i+1][j+1]=dp[i][j]+1; }
          else { dp[i+1][j+1]=0; }
          res=max(res,dp[i+1][j+1]);
      }
  }
  cout << res << '\n';
}






정리글



Link
velog.io/@emplam27/알고리즘-그림으로-알아보는-LCS-알고리즘-Longest-Common-Substring와-Longest-Common-Subsequence






This post is licensed under CC BY 4.0 by the author.