如何將抓取的內容寫入CSV文件？

Question

我需要一些幫助，以將基本的網頁抓取工具的輸出保存到CSV文件。

這是代碼：

from urllib.request import urlopen
from bs4 import BeautifulSoup
import csv

html_ = urlopen("some_url")
bsObj_ = BeautifulSoup(html_, "html.parser")
nameList_ = bsObj_2.findAll("div", {"class":"row proyecto_name_venta"})

for name in nameList_:

    print(name.get_text())

具體來說，我想將name.get_text()結果保存到CSV文件中。

Answer 1

如果nameList_中的元素是帶有以','分隔的列的行','嘗試以下操作：

import csv

with open('out.csv', 'w') as outf:
    writer = csv.writer(outf)
    writer.writerows(name.get_text().split(',') for name nameList_)

如果nameList_.get_text()只是一個字符串，並且您想編寫單列CSV，則可以嘗試以下操作：

import csv

with open('out.csv', 'w') as outf:
    writer = csv.writer(outf)
    writer.writerows([name.get_text()] for name in nameList_)

Answer 2

這是您所要求的非常全面的示例。 。。。

import urllib2

listOfStocks = ["AAPL", "MSFT", "GOOG", "FB", "AMZN"]

urls = []

for company in listOfStocks:
    urls.append('http://real-chart.finance.yahoo.com/table.csv?s=' + company + '&d=6&e=28&f=2015&g=m&a=11&b=12&c=1980&ignore=.csv')

Output_File = open('C:/Users/rshuell001/Historical_Prices.csv','w')

New_Format_Data = ''

for counter in range(0, len(urls)):

    Original_Data = urllib2.urlopen(urls[counter]).read()

    if counter == 0:
        New_Format_Data = "Company," + urllib2.urlopen(urls[counter]).readline()

    rows = Original_Data.splitlines(1)

    for row in range(1, len(rows)):

        New_Format_Data = New_Format_Data + listOfStocks[counter] + ',' + rows[row]

Output_File.write(New_Format_Data)
Output_File.close()

如何將抓取的內容寫入CSV文件？

問題描述

2 個解決方案

解決方案1
1 2016-01-03 19:01:42

解決方案2
0 已采納

如何將抓取的內容寫入CSV文件？

問題描述

2 個解決方案

解決方案1 1 2016-01-03 19:01:42

解決方案2 0 已采納

解決方案1
1 2016-01-03 19:01:42

解決方案2
0 已采納