簡體   English   中英

如何搜索一行中所有出現的泰米爾字符?

[英]how to search for all occurrences of a Tamil character in a line?

我正在嘗試編寫一個程序來檢查行/句子中是否出現了泰米爾語字符。 我編寫了一個代碼,它檢查行中是否存在該字符,如果退出則不檢查第二或第三次出現。 這是代碼:(我將單詞分為字符,所以我要檢查“單詞”)。

    count=0
    word="ஆ"
    f=open('input','r')
    for line in f.readlines():
        if word in line:
            count=count+1
    print count
    f.close()

輸入文件“輸入”具有:

   ஆ ன் டை ன்  
   ஆ ன் டை னி ன் 
   ஆ ன் டொ வி ன் 
   ஆ ன் ட் டா ல ஜி 
   எ ன் றி ஆ ன் 
   ஆ ன் ட் ட ன் ஆ

當前輸出為:

count:6

但輸出應為:

count:7

在最后一行中,它檢查單詞出現在開頭,然后退出。 我希望它檢查整行並計數所有出現的次數。 我該如何修改?

當前,您僅檢查字符是否完全在一行中,而沒有計算出現的次數。 count方法可以執行您想要的操作: https : //docs.python.org/2/library/stdtypes.html#str.count

>> 'hello world'.count('l')
3 

另外,正如Wooble在他的評論中已經指出的那樣,當在python2中使用非ascii字符時,您必須格外小心(他為您提供了所需的信息)。

嘗試open-tamil庫,您可以從pip安裝該庫:

$ pip install open-tamil

使用方法如下:

import tamil
letters_list = tamil.utf8.get_tamil_letters( string_input )

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM