簡體   English   中英

使用grep從R中的txt文件提取數據

[英]Using grep to extract data from a txt file in R

對於一個班級,我必須為每個模型年的汽車類型找到不同的價格。 我們被告知只能使用cars.com並將所有文本復制並粘貼到記事本txt文件中,一旦我們縮小了縫隙。 然后保存並使用:

grep'\\ $'tmpHondaCRV2012.txt> hondaCRV2012.txt

我不是程序員,所以我真的不知道那是什么意思,但是我至少知道正確地保存了文件並正確輸入了所有內容,但是它始終顯示錯誤消息“'\\ $',這是無法識別的轉義在以“'\\​​ $”開頭的字符串中...我不知道那是什么意思。 有什么建議么?

此grep命令將在Linux上的終端中輸入,而不是在R控制台中輸入。

但是,如果您使用的是Linux,則可以以這種方式輸入R控制台:

system("grep '\\$' tmpHondaCRV2012.txt > hondaCRV2012.txt")

如果您想直接從網絡獲取值:

install.packages('XML')
library(XML)
html.raw<-htmlTreeParse(
  'http://www.cars.com/for-sale/searchresults.action?dlId=&dgId=&AmbMkNm=Honda&AmbMdNm=Civic&AmbMkId=20017&AmbMdId=20823&searchSource=ADVANCED_SEARCH&rd=100000&zc=02747&uncpo=2&cpo=&stkTyp=U&VType=&mkId=20017&mdId=20823&alMkId=20017&prMn=&prMx=&clrId=&yrMn=1997&yrMx=1997&drvTrnId=&mlgMn=&mlgMx=&transTypeId=&kw=&kwm=ANY&ldId=&rpp=100&slrTypeId=',
  useInternalNodes=T
)
html.parse<-xpathApply(html.raw, "//span[@class='priceSort']", xmlValue)
values <- unlist(html.parse)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM