繁体   English   中英

如何通过python3删除以函数开头的行

[英]How to delete a line with starts with function by python3

我想在50,000个Wiki页面中删除一行。 因为该行是无效的外部网页链接。 例如,查看此Wiki页面。 该行包括两部分。 一个是起始文本,另一个是URL。 每个单词的URL都不同,但文本始终以'*தமிழ்இணையப்அகரமுதலியில்'开头。 如何删除以功能开头的行?

Sample code :

#!/usr/bin/env python
#-*- coding: utf-8 -*-
wikiPage = '''==உசாத்துணை== 
* தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில்  [http://www.tamilvu.org/slet/servlet/o33.o33searh?CboSelect=1&TxtSearch=abdominal+muscle&OptSearch=&id=All abdominal muscle]'''

# part1 is a line of  'starts with'
part1 = '* தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில் '
part2 = '[http://www.tamilvu.org/slet/servlet/o33.o33searh?CboSelect=1&TxtSearch=abdominal+muscle&OptSearch=&id=All abdominal muscle]'
print(wikiPage.replace('part1',''))

怎样也删除part2? 请注意,第2部分是每个Wiki页面都不同的URL。

创建一个新的行列表(或存储行),然后遍历旧列表,只添加不以该字符串开头的行。

START_OF_LINE = "*தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில்"
new_lines = [] # or however you store lines

for line in lines:
    if line.startswith(START_OF_LINE):
        pass
    else:
        new_lines.append(line)
s_line = '*தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில்'

lines = [line for line in lines if not line.startswith(s_line)]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM