簡體   English   中英

使用熊貓從txt文件中分離數據

[英]separating data from a txt file using pandas

我在txt文件中有數據,需要分開數據。 道歉,但我真的很難(可能很難解釋)。 以下是txt文件的前幾行(一千行)。 我需要第0行中的第一個*和第700行中的最后一個*之間的所有數據。我不想按行號進行選擇,因為數字可以更改,但是我想要一個可以在*之間選擇數據的代碼。 其次,數據不分成幾列,而是一大行。 我想要第二段代碼可以將數據分成幾列,即后報告,計算日期,索引代碼是列(我不能在空間上分開,因為當它們應該是一列時,它將計算和日期分成單獨的列。)請可以有人幫助我,謝謝!

                                                     0
0                                                    *
1    #124 Latter REPORT                      D51D   ...
2    #  1 Calculation Date                  calc_da...
3    #  2 Index Code                        modes2_in...
4    #  3 Index Name                        index_n...
120  #120 5 Years ADPS Growth Rate          5_years...
121  #121 1 Year ADPS Growth Rate           1_year_...
122  #122 Payout Ratio                      payout_...
123  #123 Reserved 26                       reserve...
124  #124 Reserved 27                       reserve...
125                                                  *

假設數據框名為dat ,則第一部分將查找星號:

asterisk_location = dat[0] == '*'

asterisk_location = asterisk_location[asterisk_location]

start, finish = asterisk_location.index

dat = dat.iloc[start+1:finish]

這也假設您要獲取前兩個星號之間的區域。 如果還有更多,則必須稍作調整。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM