簡體   English   中英

如何在Spacy管道nlp中加載數據幀或csv文件?

[英]How to load Data Frame or csv file in spacy pipeline nlp?

我正在嘗試將數據幀csv加載到spacy管道中。 我收到參數字符串錯誤,這是我的代碼。

from __future__ import unicode_literals
nlp = spacy.load('en')

data = pd.read_csv("sometextdata.csv")
text = []
for line in data.Line:
    text.append(clean_text(line))

    text_spacy = nlp(data['Line'])
    data['Line'].apply(nlp)
    document = nlp(text)
TypeError: Argument 'string' has incorrect type (expected unicode, got str)

我試圖以不同的方式加載我遇到了同樣的錯誤。

平台 :OS-Mac和python 2.7

您應該將可變文本轉換為unicode。 如您所見,現在具有str類型。 例如,您可以嘗試像

document = nlp(unicode(text))

或喜歡

document = nlp(text.decode())

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM