想要使用 python 将网页中的值提取为字典格式

Question

我想从网页上删除姓名、电话号码和 email，但似乎整个细节都在字典中，有人请纠正我，我很困惑如何在特定列中提取这些值。 这是代码

import requests
from bs4 import BeautifulSoup
from csv import writer

url ='https://mainapi.dadeschools.net/api/v1/employees?limit=10&skip=0&sortDesc=false'
R = requests.get(url)

soup = BeautifulSoup(R.text, 'html.parser')
print(soup)
with open('school.csv', 'a', encoding='utf8', newline ='') as f:
thewriter = writer(f)
header = ['Name', 'Location', 'Phone Number', 'Email' ]
thewriter.writerow(header)
thewriter.writerow(soup)

Answer 1

It do not need BeautifulSoup as mentioned simply requets the api and transform JSON viacsv.DictWriter to CSV.

例子

import requests, csv

url ='https://mainapi.dadeschools.net/api/v1/employees?limit=10&skip=0&sortDesc=false'
data = requests.get(url).json()['items']
data
with open('my.csv', 'w', newline='') as output_file:
    dict_writer = csv.DictWriter(output_file, data[0].keys())
    dict_writer.writeheader()
    dict_writer.writerows(data)

编辑

正如Barry the Platipus所提到的，go 和pandas也有一种和多种方法：

import pandas as pd

pd.json_normalize(
    pd.read_json('https://mainapi.dadeschools.net/api/v1/employees?limit=10&skip=0&sortDesc=false')['items']
).to_csv('my.csv', index=False)

或者

pd.DataFrame(
    pd.read_json('https://mainapi.dadeschools.net/api/v1/employees?limit=10&skip=0&sortDesc=false')['items']\
    .values.tolist()
).to_csv('my.csv', index=False)

想要使用 python 将网页中的值提取为字典格式

问题描述

1 个解决方案

解决方案1
1 2022-09-26 18:05:34

例子

编辑

想要使用 python 将网页中的值提取为字典格式

问题描述

1 个解决方案

解决方案1 1 2022-09-26 18:05:34

例子

编辑

解决方案1
1 2022-09-26 18:05:34