繁体 English 中英

用于python的网络爬虫的数据库？

[英]Database for web crawler in python?

原文 2010-01-27 00:16:35 5 4 python/ database/ web-crawler

您好，我是用python编写的网络爬虫，用于从nytimes.com等新闻网站中提取新闻报道。 我想知道什么可以用作该项目的后端数据库？

提前致谢！

4 个解决方案

使用CouchDB，MongoDB或SimpleDB等文档数据库可能是一个很棒的项目。

MongoDB有一个托管解决方案： http : //mongohq.com 。 Python（Pymongo）也有一个绑定。

如果要在Amazon Web Services上托管SimpleDB，则它是一个不错的选择

CouchDB是来自Apache Foundation的开源软件包。

就我个人而言，我喜欢PostGreSQL-但是其他免费的DB，例如MySql （或者，如果您的数据量非常小-最多几个GB-甚至Python附带的SQLite ）也可以。

我认为数据库本身可能是像这样的Web爬虫更容易的方面之一。

如果期望读取或写入数据库的高负载（例如，如果您打算同时运行多个搜寻器），则您将希望转向MySql的方向，否则像Sqlite这样的东西可能就可以了。

你可以看看火鸟

Firebird python驱动程序由核心团队开发

Python web 爬虫与 MySQL 数据库

[英]Python web crawler with MySQL database

适用于Yelp的Python中的Web爬网程序

[英]Web Crawler in Python for Yelp

Python Web搜寻器无输出

[英]Python web crawler no output

简单的Python Web搜寻器

[英]Simple Python web crawler

Web搜寻器中的Python重复项

[英]Python duplicates in web crawler

Python 网络爬虫没有结果

[英]Python Web Crawler No Results

使用Python分发Web搜寻器

[英]Distributing a web crawler in Python

在Python 3中使用多处理的Web爬虫

[英]Web Crawler with multiprocessing in Python 3

使用Python的网络爬虫

[英]Web Crawler With Python

python web爬虫中的递归

[英]Recursion in python web crawler

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Python web 爬虫与 MySQL 数据库适用于Yelp的Python中的Web爬网程序 Python Web搜寻器无输出简单的Python Web搜寻器 Web搜寻器中的Python重复项 Python 网络爬虫没有结果使用Python分发Web搜寻器在Python 3中使用多处理的Web爬虫使用Python的网络爬虫 python web爬虫中的递归

相关标签

用于python的网络爬虫的数据库？

问题描述

4 个解决方案

解决方案1
6 已采纳 2010-01-27 02:26:10

解决方案2
3 2010-01-27 00:20:40

解决方案3
1 2010-01-27 00:23:40

解决方案4
0 2010-01-27 20:51:19

用于python的网络爬虫的数据库？

问题描述

4 个解决方案

解决方案1 6 已采纳 2010-01-27 02:26:10

解决方案2 3 2010-01-27 00:20:40

解决方案3 1 2010-01-27 00:23:40

解决方案4 0 2010-01-27 20:51:19

解决方案1
6 已采纳 2010-01-27 02:26:10

解决方案2
3 2010-01-27 00:20:40

解决方案3
1 2010-01-27 00:23:40

解决方案4
0 2010-01-27 20:51:19