[英]How to print all rows containing a part of input?
我有一个包含序列和基因名称的 csv 文件。 我想从用户那里获取输入并打印包含用户输入的所有行作为一部分。 例如我的数据是;
Gene 1 ATGCGGTCTA
Gene 2 ACGCCCATGA
Gene 3 TCGAC
当用户进入 GC 时,结果必须是
Gene 1 ATGCGGTCTA
Gene 2 ACGCCCATGA
因为两者在序列中都有 GC。
到目前为止,我尝试;
import csv
import sys
import pandas as pd
csv_file = csv.reader(open('DATA.csv', "r"), delimiter=",")
z=input('what would you like to search?').lower()
if z=='sequence':
s=input('Enter sequence : ').upper()
df = pd.read_csv('DATA.csv')
a = list(df['seq'])
b = ' '.join(str(s) for s in a)
c= b.find(s)
使用pandas
并假设您的 dataframe 中带有序列的列称为sequences
,您可以执行以下操作: filtered_df = df[df['sequences'].str.contains(s)]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.