簡體   English   中英

R在數據幀的列中標識文本字符串

[英]R Identifing text string within column of dataframe

我的數據框的一列有單詞和短語。 我正在嘗試為此列中的那些字段創建一個虛擬變量,其中包含特定的文本字符串。

例如:

  • 風箏
  • 汽車
  • 盒子風箏
  • 模型車
  • 我喜歡放風箏
  • 世界汽車

      myvector<-c("kite","cars","box kites","model cars","i like kites that fly", "cars of the world") 

我想用字符串“kite”識別所有字段

我已經嘗試了一些東西,比如any()which()%in%但到目前為止還沒有任何工作。

任何幫助非常感謝

您沒有提供任何可重現的示例。 但你的答案將是grepl。

grepl("kite", df$words)

如果單詞在行中,它將返回邏輯向量。

如果要匹配多個單詞,請使用logical或| 在匹配的字符串內

grepl("kite|cars|box kites", df$words)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM