簡體   English   中英

找到最長的回文 DNA 子序列,上面有最多的突變

[英]Find the longest palindromic DNA sub-sequence that has the most mutations on it

我一直在嘗試為大學做動態編程作業,但到目前為止我沒有成功。

問題:

給定一個 DNA 字符串和一個突變位置列表(例如,片段 0 和 2 是突變),找到包含最多突變的最長回文子序列。

輸入:一個 0 到 2000 個字符的字符串 S; 一個整數 N 使得 0<=N<=|S| 和 N 個位置(從 0 到 |S| 的數字)突變。

輸出:一個整數,表示包含最大突變數的最長回文子序列的大小。

例子:

輸入:CAGACAT 0

輸出:5

輸入:GATTACA 1 0

輸出:1

輸入:GATTACA 3 0 4 5

輸出:3

輸入:TATACTATA 2 4 8

輸出:7

我們必須用 C 編寫它,但我真正需要的是想法,任何語言或偽代碼對我來說都很好。

我查找 LPS 的代碼(在 C 中)

int find_lps(char *input)
{
    int len = strlen(input), i, cur_len;
    int c[len][len];

    for (i = 0; i < len; i++)
        c[i][i] = 1;

    for (cur_len = 1; cur_len < len; cur_len++) {
        for (i = 0; i < len - cur_len; i++) {
            int j = i + cur_len;

            if (input[i] == input[j]) {
                c[i][j] = c[i + 1][j - 1] + 2;
            } else {
                c[i][j] = max(c[i + 1][j], c[i][j - 1]);
            }
        }
    }

    return c[0][len - 1];
}

我試圖為突變做些什么:

1- 創建 LPS 更改位置的數組。 那行不通,真的,我不知道該怎么做。

有關問題的更多詳細信息:在您有 n 個回文子序列的情況下,它們內部的突變大小相同,我需要它們中最長的一個。 鑒於您有 n 個帶有 X 突變的回文子序列(我們有 M 突變),考慮到您沒有帶有 M 突變的回文子序列,我需要最長的 X 突變回文子序列。 如果你這樣做,那么你應該選擇另一個子序列,即使它更短。 所以,第一個標准:回文子序列中的大多數突變。 如果我們有相同的數量,那么最長的子序列。

任何幫助表示贊賞,謝謝。

讓我們定義 C[i][j] 來存儲 2 個值:

1- 子串 S(i,j) 中包含最多突變的最長回文子序列的長度,用C[i][j].len 表示

2- 子串 S(i,j) 中包含最多突變的最長回文子序列的突變數,用C[i][j].ms 表示

那么問題的結果將是 C[0][|S|-1].len

注意:m[i] = 1 表示字符 s[i] 是一個變異,否則 m[i] = 0

這是用 C++ 編寫的完整代碼:

#include <iostream>
#include <string>
using namespace std;


string s;
int m[2001];

struct Node {
    int ms;//number of mutations
    int len;

    Node() {
        ms = len = 0;
    }

    Node(int v1,int v2) {
        ms = v1;
        len = v2;
    }
};

Node C[2001][2001];


Node getBestNode(Node n1, Node n2) {
    if (n1.ms > n2.ms)
        return n1;

    if (n1.ms <  n2.ms)
        return n2;

    if (n1.len > n2.len)
        return n1;

    if (n1.len < n2.len)
        return n2;  

    return n1;
}

void init() {
    for (int i = 0; i < 2001; i++) {
        m[i] = 0;
        for (int j = 0; j < 2001; j++)  C[i][j] = Node(0,0);
    }
}

void solve() {
    int len = s.length();

    // initializing the ranges of length = 1
    for (int i = 0; i < len; i++)
        C[i][i] = Node( m[i],1 );

    // initializing the ranges of length = 2
    for (int i = 0; i < len - 1; i++) 
        if (s[i] == s[i + 1])
            C[i][i + 1] = Node(m[i] + m[i + 1],2);
        else if (m[i] || m[i + 1])
                C[i][i + 1] = Node(1,1) ;

    // for ranges of length >= 3
    for (int cur_len = 3; cur_len <= len; cur_len++)
        for (int i = 0; i <= len - cur_len; i++) {

            int j = i + cur_len - 1;

            C[i][j] = getBestNode(C[i + 1][j], C[i][j-1]);

            if (s[i] == s[j]) {
                Node nn = Node(
                    C[i + 1][j - 1].ms + m[i] + m[j] , 
                    C[i + 1][j - 1].len + 2
                );

                C[i][j] = getBestNode(C[i][j], nn);
            }
        }
}

int main() {

    int n;  
    cin >> s >> n;

    init();//initializing the arrays with zeros

    for (int i = 0; i < n; i++) {
        int x;  cin >> x;
        m[x] = 1;
    }

    solve();

    cout << C[0][s.length()-1].len << endl; 
    return 0;
}

函數getBestNode()通過考慮突變數量和子序列的長度來返回 2 個解決方案中的最佳解決方案。

注意:代碼可以更短,但為了清楚起見,我這樣做了。

嘗試訪問我的頁面https://github.com/keroykeroy/Longest-Palindromic-Sequence,但我使用php查找最長的回文序列。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM