[英]Google spreadsheet data into pandas dataframe
我正在尝试将Google电子表格中的数据转换为pandas
进行分析。 我在一个工作表中有几个数据集,因此我无法将导入用作此处显示的CSV示例:将Google电子表格CSV转换为Pandas Dataframe
这就是我在电子表格中看到的数据:
Date letters numbers mixed
1/1/2014 a 3 z1
1/2/2014 b 2 y2
1/3/2014 c 1 x3
我已经使用gspread
进行导入,并且可以使每行观察数据看起来像这样:
[['Date', 'letters', 'numbers', 'mixed'], ['1/1/2014', 'a', '3', 'z1'], ['1/2/2014', 'b', '2', 'y2'], ['1/3/2014', 'c', '1', 'x3']]
我的问题是如何将它带入带有数字索引的pandas数据帧? 我不希望日期成为索引。 我需要一个通用的解决方案,我的数据集是1000行乘50列。
这就是我要做的
import pandas as pd
d=[['Date', 'letters', 'numbers', 'mixed'],\
['1/1/2014', 'a', '3', 'z1'],\
['1/2/2014', 'b', '2', 'y2'],\
['1/3/2014', 'c', '1', 'x3']]
df = pd.DataFrame.from_records(d[1:],columns=d[0])
df.set_index('numbers')
这是结果
Date letters mixed
numbers
3 1/1/2014 a z1
2 1/2/2014 b y2
1 1/3/2014 c x3
对于其他想要将pandas
数据帧与Google表格连接起来的人,请不要再犹豫了! gspread-dataframe
就在这里。 它提供了gspread
和pandas
之间缺失的联系。
使用pip install gspread-dataframe
。
将谷歌电子表格转换为python pandas的另一种方法是使用df2gspread: http ://df2gspread.readthedocs.io/en/latest/overview.html#usage1
设置需要10分钟,只需3行代码即可完成:
from df2gspread import gspread2df as g2d
df = g2d.download(gfile="your_spreadsheet_ID", col_names=True, row_names=True)
我只是设置了这个,所以如果你有任何问题,请随时提出。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.