繁体   English   中英

数据帧中的Python for循环

[英]Python for loop in dataframe

美好的一天,伙计们! 请小心 COVID19 并解决 1 个问题。

我真的很想通过下面的爬行得到地址 B 列的值并将其放在 F 列中。 → 这是我得到的问题

这是我的消息来源。 (这是制作简单数据框的来源。)

Start_Page = 0
End_Page = 500

for i in range(Start_Page, End_Page):
    page = i + 1
    url = "http://www.example.com &start=" + str(page)
    res = urllib.request.urlopen(url)
    json_str = response.read().decode("utf-8")
    json_object = json.loads(json_str)
    Mark = pd.json_normalize(json_object['jobs']['job'])
    df = pd.DataFrame(Mark)
    df = df[['A', 'B', 'C', 'D', 'E']]

列的名称是 A 到 E。

我真的很想通过下面的爬行得到B列的值的地址,放到F列。

(这是爬行的来源。)

B = B     # B in dataframe 'df'
result = urlopen("http://www.example2.com" + B)
html = result.read()
soup = BeautifulSoup(html, 'html.parser')

address = str(soup.select_one("address.txt_address > span"))
address = re.sub('<.+?>', '', address, 0).strip()
B = B2 → append address to F2
...
...
...
B = B110000 → append address to F110000

如何通过使用 B 的值作为变量来创建将地址添加到 F 列的“for 循环”? (我找了一个星期的方法,但是太难找了。)

我不确定我是否理解正确的问题,

但是如果您尝试使用来自的值获取一些地址

'B' 列并将其保存到新的 'F' 列,

您可以选择“B”列并将其放入for循环中。

values_for_f = []
for i in df['b'].values:
    result = urlopen("http://www.example2.com" + i)
    ....
    address = re.sub('<.+?>', '', address, 0).strip()
    values_for_f.append(address)
df['f'] = values_for_f

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM