[英]Cant use function to a dataset
我有一個任務要檢查頁面是否為英文,並且以下代碼由於編寫而無法編譯:
預期的字符串或類似字節的對象
train = pd.read_csv('UDSclub/wikipedia_train.csv')
def get_language(page):
res = re.search('[a-z][a-z].wikipedia.org', page)
if res:
return res.group(0)[0:2]
return 'na'
train['language'].apply(get_language)
我正在嘗試在DataFrame
中創建新列,如果頁面的英文不是
嘗試這個:
train = pd.read_csv('UDSclub/wikipedia_train.csv')
def get_language(x):
res = re.search('[a-z][a-z].wikipedia.org', x['page'])
if res:
language = res.group(0)[0:2]
language = 'na'
x['language'] = language
return x
train.apply(get_language)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.