繁体   English   中英

Pandas DF 标记某些列

[英]Pandas DF tokenize certain columns

我有一个 Dataframe,我有 3 列。 第 1 列是和 ID,第 2 列和第 3 列有文本。 我希望能够标记第 2 列和第 3 列,以便在稍后执行的任务中进行搜索。 我已经完成了这段代码

def tokenize_words (words):
    word_new = []
    for word in (words[:][0]):
        word_token = word_tokenize(words)
        if word_token !='':
            word_new.append(word_token)
    return word_new

我不确定如何调用我定义的这个 function?

虽然我不确定您的 function 是否真的有效,但您在 pandas 列上调用函数的方式通常是使用 Series.apply() 方法。

pd['Col2'].apply(lambda x: tokenize_words(x))

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM