繁体   English   中英

R在数据帧的列中标识文本字符串

[英]R Identifing text string within column of dataframe

我的数据框的一列有单词和短语。 我正在尝试为此列中的那些字段创建一个虚拟变量,其中包含特定的文本字符串。

例如:

  • 风筝
  • 汽车
  • 盒子风筝
  • 模型车
  • 我喜欢放风筝
  • 世界汽车

      myvector<-c("kite","cars","box kites","model cars","i like kites that fly", "cars of the world") 

我想用字符串“kite”识别所有字段

我已经尝试了一些东西,比如any()which()%in%但到目前为止还没有任何工作。

任何帮助非常感谢

您没有提供任何可重现的示例。 但你的答案将是grepl。

grepl("kite", df$words)

如果单词在行中,它将返回逻辑向量。

如果要匹配多个单词,请使用logical或| 在匹配的字符串内

grepl("kite|cars|box kites", df$words)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM