繁体   English   中英

在Debian OS上使用熊猫从github存储库读取csv文件时出现奇怪的csv输出

[英]Strange csv output when csv file is read from a github repo using pandas on Debian OS

我在csv文件中有以下数据:

XG,612.0
YG,-1924.0500000000002
ZG,-959.085
A_mod,6.889112523645457
I1_mod,0.478595694542785
I2_mod,32.64258822366686

如果我使用excel或atom打开它,一切正常。 该文件位于我的GitHub存储库的文件夹中,我不知道这是否重要,应该不重要,但是当我在python上使用pd.read_csv()函数读取该pd.read_csv() ,得到了以下结果:

在此处输入图片说明

熊猫似乎正在从文件中读取某种元数据,而不是文件本身。 我在Debian Google Cloud VM实例上从Jupyterlab运行python 3.6。 我不认为所有这些都应该成为问题,但这是我第一次看到这种情况,而且我不知道发生了什么。

有人可以告诉我如何解决此问题,并解释其原因吗?

提前非常感谢您。

编辑

这些文件包含在通过URL从github网站克隆的本地文件夹中。 因此,基本上在本地计算机上使用git clone应该会产生相同的效果。

在python中,我正在使用pd.read_csv('my_file.csv')

Anotehr奇怪的是,在Windows 10下我的个人计算机上,我完全没有读取文件的问题。 但是在Google Cloud VM实例中,使用完全相同的过程就是我遇到这个奇怪问题的地方。

您正在查看的是Git LFS指针文件,而不是实际文件。 versionoidsize是Git LFS 规范的一部分 Git LFS会使用这些文件代替存储库中的实际大数据文件。 他们应该在结帐时无缝替换。

在得到错误结果的框中检查git clone的输出。 Git LFS似乎存在配置问题。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM