符号的第一次和最后一次出现（没有正则表达式的python）

Question

我正在处理来自“ACGT”字母表（基因序列）的字符串，在开头和结尾都用字母“N”填充：

NNN...NNACGT...GGCTAANNNN...NNN

我想找到实际序列开始和结束的位置。 可以通过使用正则表达式轻松完成，但我希望使用基本的 python 字符串操作有一个更简单的解决方案。 您的建议将不胜感激。

Answer 1

要获得剩余部分（从左侧和右侧移除填充），您似乎只需要：

<YourString>.strip('N')

如果您需要查找索引，可以参考lstrip和rstrip ：

sStart = len(<YourString>)-len(<YourString>.lstrip('N'))+1
sEnd = len(<YourString>.rstrip('N'))

Answer 2

既然你提到你想找到“职位”。 下面的代码将为您提供实际序列在字符串中开始和结束的位置。

s = 'NNNNAANNNN'

i, j = s.find(next((x for x in s if x != 'N'), None)), s.rfind(next((x for x in reversed(s) if x != 'N'), None))

print(i, j)
print(s[i:j+1])

#Output
4 5
A A

Answer 3

使用条带（）

    s = "NNNNNACGTGGCTAANNNNNNN"
    s = s.strip('N')
    print(s)

符号的第一次和最后一次出现（没有正则表达式的python）

问题描述

3 个解决方案

解决方案1
3 已采纳 2020-06-04 12:18:07

解决方案2
1 2020-06-04 12:18:44

解决方案3
0 2020-06-04 12:25:19

符号的第一次和最后一次出现（没有正则表达式的python）

问题描述

3 个解决方案

解决方案1 3 已采纳 2020-06-04 12:18:07

解决方案2 1 2020-06-04 12:18:44

解决方案3 0 2020-06-04 12:25:19

解决方案1
3 已采纳 2020-06-04 12:18:07

解决方案2
1 2020-06-04 12:18:44

解决方案3
0 2020-06-04 12:25:19