[英]Strange output using Pandas when converting StringIO with read_csv
[英]Strange csv output when csv file is read from a github repo using pandas on Debian OS
我在csv文件中有以下数据:
XG,612.0
YG,-1924.0500000000002
ZG,-959.085
A_mod,6.889112523645457
I1_mod,0.478595694542785
I2_mod,32.64258822366686
如果我使用excel或atom打开它,一切正常。 该文件位于我的GitHub存储库的文件夹中,我不知道这是否重要,应该不重要,但是当我在python上使用pd.read_csv()
函数读取该pd.read_csv()
,得到了以下结果:
熊猫似乎正在从文件中读取某种元数据,而不是文件本身。 我在Debian Google Cloud VM实例上从Jupyterlab运行python 3.6。 我不认为所有这些都应该成为问题,但这是我第一次看到这种情况,而且我不知道发生了什么。
有人可以告诉我如何解决此问题,并解释其原因吗?
提前非常感谢您。
编辑
这些文件包含在通过URL从github网站克隆的本地文件夹中。 因此,基本上在本地计算机上使用git clone
应该会产生相同的效果。
在python中,我正在使用pd.read_csv('my_file.csv')
。
Anotehr奇怪的是,在Windows 10下我的个人计算机上,我完全没有读取文件的问题。 但是在Google Cloud VM实例中,使用完全相同的过程就是我遇到这个奇怪问题的地方。
您正在查看的是Git LFS指针文件,而不是实际文件。 version
, oid
和size
是Git LFS 规范的一部分 。 Git LFS会使用这些文件代替存储库中的实际大数据文件。 他们应该在结帐时无缝替换。
在得到错误结果的框中检查git clone
的输出。 Git LFS似乎存在配置问题。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.