簡體   English   中英

如何通過python3刪除以函數開頭的行

[英]How to delete a line with starts with function by python3

我想在50,000個Wiki頁面中刪除一行。 因為該行是無效的外部網頁鏈接。 例如,查看此Wiki頁面。 該行包括兩部分。 一個是起始文本,另一個是URL。 每個單詞的URL都不同,但文本始終以'*தமிழ்இணையப்அகரமுதலியில்'開頭。 如何刪除以功能開頭的行?

Sample code :

#!/usr/bin/env python
#-*- coding: utf-8 -*-
wikiPage = '''==உசாத்துணை== 
* தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில்  [http://www.tamilvu.org/slet/servlet/o33.o33searh?CboSelect=1&TxtSearch=abdominal+muscle&OptSearch=&id=All abdominal muscle]'''

# part1 is a line of  'starts with'
part1 = '* தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில் '
part2 = '[http://www.tamilvu.org/slet/servlet/o33.o33searh?CboSelect=1&TxtSearch=abdominal+muscle&OptSearch=&id=All abdominal muscle]'
print(wikiPage.replace('part1',''))

怎樣也刪除part2? 請注意,第2部分是每個Wiki頁面都不同的URL。

創建一個新的行列表(或存儲行),然后遍歷舊列表,只添加不以該字符串開頭的行。

START_OF_LINE = "*தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில்"
new_lines = [] # or however you store lines

for line in lines:
    if line.startswith(START_OF_LINE):
        pass
    else:
        new_lines.append(line)
s_line = '*தமிழ் இணையப் பல்கலைக்கழக அகரமுதலியில்'

lines = [line for line in lines if not line.startswith(s_line)]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM