[英]Download data from different sites using Node.js
我应该创建一些代码,使我可以从不同的站点下载数据(例如: WHO , Unicef , Eurostat等),然后将这些数据转换为我认为有用的格式,例如JSON
。 (如果我理解正确,那就意味着要进行网络抓取 ,对吧?)。
数据可以采用不同的格式: html
, PDF
, xlsx
, tsv
, csv
等。例如:
我需要对其进行处理并将其转换为统一格式,以便可以对其进行比较。
显然,数据收集可以手动完成,但我更喜欢自动执行的过程。
我从来没有做过这样的事情,我也不知道如何开始。
目前,我仅使用客户端Javascript
而对服务器端编程知之甚少。 他们建议我使用Node.js
, Express.js
和MongoDB
。 我已经读到MEAN
存在:一种用于构建动态网站和Web应用程序的JavaScript软件,但我不知道如何使用它。
我从未使用过Node.js
, Express.js
或MongoDB
。 我很高兴学习,但我需要帮助。
有人能帮我吗? 我没有找到适合我的情况的教程或指南。
谢谢!
您只需要与URL对话的内容即可。 您可以使用Node.js或任何其他框架进行操作,该框架提供了与URL对话的功能。 之后,您可以编写一个解析器来根据需要清理数据。
这是到页面的链接,该页面描述了如何在Node中执行此操作。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.