繁体   English   中英

从列表列表中删除包含特定字符串的列表

[英]Removing lists that contain specific string from list of lists

我有以下列表:

print(sentences_fam)

>>>[['30973', 'ok'], 
   ['3044', 'ok'], 
   ['53690', 'fd', '65', 'ca'], 
   ['36471', 'none','good','standing'], 
   ['j6426', 'none'], 
   ['500861', 'm', 'br'], 
   ['j0076', 'none'], 
   ['mf4422', 'ok'], 
   ['jf1816', 'father', '64', 'ca'], 
   ['500854', 'no', 'fam', 'none', 'hx'], 
   ['54480n', 'none'], 
   ['mf583', 'none'],
   ...]

print (len(sentences_fam))
>>> 1523613

列表有许多不同的长度,并包含各种不同的字符串。 我正在尝试删除所有包含关键字“无”的列表。 根据上面的列表,我想要的 output 应该是这样的。

[['30973', 'ok'], 
['3044', 'ok'], 
['53690', 'fd', '65', 'ca'],  
['500861', 'm', 'br'],  
['mf4422', 'ok'], 
['jf1816', 'father', '64', 'ca'],
...]

我的列表理解能力仍然不是很好,所以我不知道该怎么做。 我曾尝试将此列表转换为 dataframe 但我没有运气,因为每个字符串都被分配了一个单独的列,而且我还没有找到将数据再次格式化为列表列表的好方法。 我需要这种类型的格式才能将数据传递给 word2vec 库。

基本上整个列表是文本的主体,每个子列表是一个句子。 另外请记住,我需要将其应用于大型列表,因此性能/效率可能很重要。

filtered_list = [sublist for sublist in sentences_fam if "none" not in sublist]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM