繁体   English   中英

应用功能从数据帧的每一行中选择特定的单词

Apply function to select specific words from each row of a dataframe

提示:本站收集StackOverFlow近2千万问答,支持中英文搜索,鼠标放在语句上弹窗显示对应的参考中文或英文, 本站还提供   中文繁体   英文版本   中英对照 版本,有任何建议请联系yoyou2525@163.com。

您能给我一个提示如何进行这项工作吗?

我已经创建了一个函数,该函数应该根据数据帧每一行的句子的第一个元素从每一行中选择特定的单词:

 def distilerator(string):
  '''Input: a dataframe row containing a sentence
     Output: depending on the first word, return a specific selection'''
    if string.str.contains("hello"):
      return string.str.split('\\n')[0]
    else:
      return string.str.split('\\n')[0:2]

数据框为:

A             B
hello\blah    456
123\foo\bar   678

然后,我尝试将apply函数“应用”到名为“ description”的新列中:

df['description'] = df['A'].apply(distilerator, axis=1) #axis =1 aims to apply to each row

所需的产品是这样的数据框:

A             B       description
hello\blah    456     hello
123\foo\bar   678     foo bar

我试图尽我所能表达自己...

问题暂未有回复.您可以查看右边的相关问题.
1 将函数应用于数据帧的每一行

下面实施的更优雅的方式是什么? 我想将一个函数: my_function应用于数据帧,其中数据帧的每一行都包含函数的参数。 然后我想将函数的输出写回数据帧行。 ...

2 将函数应用于数据框中的每一行

我正在尝试为数据框中的每一行应用以下函数。 数据框如下所示: 我试图生成第四列来总结其他列的“投票”并产生获胜者,如下所示: 我目前尝试过: 然而,整列都充满了平局。 我认为这与我构建函数的方式有关,但无法弄清楚是什么 ...

3 将功能应用于数据框中的特定行

我有一个要清理特定行的数据框,在本例中为第一行。 我编写了一个函数,如果正则表达式匹配,我相信该函数将返回字符串。 def clean_cells(string): if '201' in string: return re.findall('201[0-9]', s ...

4 在数据框的每一行上应用函数并返回一个数据框

我想用jiebar分割一些中文句子,这些句子存储在数据框中,一种方法是将数据框转换为列表,然后使用apply_list。 数据集:weibo $ weibo 但是,如果我这样做的话,返回列表的大小是原始数据集的3倍。 因此,我想使用ldply / laply将结果作为数据帧返回 ...

2017-03-31 04:24:37 0 105   r/ nlp
5 将具有3个参数的函数应用于数据框中的每一行

我正在尝试将函数应用于R中数据框的每一行。我已经在Stack Overflow中经历了几个答案,但它们无法正常工作。 基本上我有一个经度和纬度信息的数据框。 函数convertLngs2接受3个输入->来自数据帧的经度信息列,源经度和目标经度。 如果源经度和目标经度之差大于180 ...

6 Scala为数据帧中的每一行应用一个函数[重复]

这个问题已经在这里有了答案: 将功能应用于Spark DataFrame 1的 每一行 我在Scala中有一个数据框,在这里我需要为每行应用一个函数: 我需要编写一个名为postToDB的函数,在该函数中,我需要将失败的记录返回到数据库,最后返回一个行的数据 ...

7 将函数应用于Spark DataFrame的每一行

我在Spark 1.3上。 我想将一个函数应用于数据帧的每一行。 此函数散列行的每一列并返回散列列表。 运行此代码时出现NullPointerException。 我认为这与SPARK-5063有关 。 如果不使用嵌套映射,我无法想到实现相同结果的方法。 ...

8 使用Apply函数取消列出数据框中的每一行

我有一个名为in.json的文件作为输入。 您可以在这里找到此文件的内容 使用此答案,我尝试使用以下代码将json转换为csv: 但是,当我键入nrow(df)时,我可以看到只有2行,但是根据项目的每个ID,我必须有更多行。 ...

2015-03-25 13:28:11 1 507   r
9 对数据帧的每一行迭代应用优化函数

我有一个适用于单行的工作optim函数。 optim函数通过最小化残留量来估计化学数据中的矿物比例。 我想对数据框中的每一行应用相同的函数(实际上可能有大量的行)。 我试过从dplyr使用 rowwise ,但它不正确。 数据: 理想矿物成分的数据框如下: 矿物比例的初步估计 实 ...

10 按组将函数应用于 Pandas 数据框中的每一行

我构建了一个由基因名称索引的Pandas数据框(下面的示例),它具有列和整数的样本名称作为单元格值。 我想要做的是运行方差分析( f_oneway() ,来自scipy.stats )用于由与样本组对应的列列表定义的行值列表。 然后将这些结果存储在一个新的Pandas数据框中,组名作为列,索引的基因 ...

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2022 STACKOOM.COM