繁体   English   中英

如何使用 Pandas 从私有 GitHub 存储库中读取 excel 数据框?

[英]How to read an excel dataframe from a private GitHub repository using pandas?

我有一个使用 django 制作的工作网站。 我有一个私有的 GitHub 存储库,里面有我想使用pandas read_excel读取并在网站上使用的 excel 文件。 我将存储库设为私有的原因是因为数据是特定于公司的。

1) 如何使用 Pandas 从私有 GitHub 存储库读取 excel 文件? 我需要设置个人访问令牌吗?

2)用户登录我的网站后,当他们导航以尝试查看他们公司特定的数据框时,是否有办法要求输入更多密码? 例如,“用户 A”将只能访问“数据框 A”,而“用户 B”将只能访问“数据框 B”。

在我的本地系统上,以下代码可以读取数据帧:

file_path = 'C:/Users/james/Desktop/projects/path/to/excel/file
df = pd.read_excel(file_path)

对于我的实时网站,产生问题的代码是:

URL_path = 'https://github.com/path/to/excel/file/in/private/repository
df = pd.read_excel(URL_path)

我能够在我的本地计算机上读取 excel 文件,但是当我尝试从我的私人 github 读取时,我收到以下错误,即使我知道我使用的是正确的 url:

urllib.error.HTTPError: HTTP Error 404: Not Found

我通过注销我的 github 帐户来验证这一点,并尝试使用我的 excel 访问 github url,由于我未登录,它会将我带到404 not found页面。当我登录到我的 github 帐户时,同样URL 将我带到正确的页面。

如果 repo 设置为私有,您应该需要使用来自 github 的 PAO(个人访问令牌)。

然后,您需要收集数据的原始 url 链接,并确保在使用 Pandas 读取它之前正确解码它。

在此处查看本教程; 它使用的是 csv,但想法基本相同:

https://medium.com/towards-enterprise/importing-a-csv-file-from-github-in-a-jupyter-notebook-e2c28e7e74a5

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM