繁体   English   中英

使用熊猫从txt文件中分离数据

[英]separating data from a txt file using pandas

我在txt文件中有数据,需要分开数据。 道歉,但我真的很难(可能很难解释)。 以下是txt文件的前几行(一千行)。 我需要第0行中的第一个*和第700行中的最后一个*之间的所有数据。我不想按行号进行选择,因为数字可以更改,但是我想要一个可以在*之间选择数据的代码。 其次,数据不分成几列,而是一大行。 我想要第二段代码可以将数据分成几列,即后报告,计算日期,索引代码是列(我不能在空间上分开,因为当它们应该是一列时,它将计算和日期分成单独的列。)请可以有人帮助我,谢谢!

                                                     0
0                                                    *
1    #124 Latter REPORT                      D51D   ...
2    #  1 Calculation Date                  calc_da...
3    #  2 Index Code                        modes2_in...
4    #  3 Index Name                        index_n...
120  #120 5 Years ADPS Growth Rate          5_years...
121  #121 1 Year ADPS Growth Rate           1_year_...
122  #122 Payout Ratio                      payout_...
123  #123 Reserved 26                       reserve...
124  #124 Reserved 27                       reserve...
125                                                  *

假设数据框名为dat ,则第一部分将查找星号:

asterisk_location = dat[0] == '*'

asterisk_location = asterisk_location[asterisk_location]

start, finish = asterisk_location.index

dat = dat.iloc[start+1:finish]

这也假设您要获取前两个星号之间的区域。 如果还有更多,则必须稍作调整。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM