熊貓讀取“分隔”文件

Question

嗨，我有這樣的.txt文件，第一列代表索引，后面是一對“（）”內的三列代表x，y和z坐標。

我想將此文件的前四列加載到pandas Dataframe。 然而，我發現這很難，因為分隔符首先是“”然后“（”並且在括號內有“，”。

有人能給我一些如何處理這種情況的暗示嗎？

謝謝！ 肖恩

Answer 1

可以編寫自己的解析器。 就像是：

碼：

def parse_my_file(filename):
    with open(filename) as f:
        for line in f:
            yield [x.strip(',()')
                   for x in re.split(r'\s+', line.strip())[:4]]

測試代碼：

df = pd.DataFrame(parse_my_file('file1'))
print(df)

結果：

    0       1       2  3
0  g1     -16       0  0
1  gr      10       0  0
2  D1  -6.858  2.7432  0
3  D2  -2.286  2.7432  0

我輸入前四行時創建了此數據文件。

Answer 2

您可以使用regex pattern作為CSV的分隔符。

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

像這樣。

import pandas as pd

df = pd.read_csv('Initial_Coordinate.txt', sep=r'[()]', header=None)
print(df)

但是，不是創建復雜的分隔符，最好將其修復為簡單的分隔符，然后使用pandas讀取它。

謝謝

熊貓讀取“分隔”文件

問題描述

2 個解決方案

解決方案1
0 2017-05-22 01:39:01

解決方案2
0 2017-05-22 01:39:54

熊貓讀取“分隔”文件

問題描述

2 個解決方案

解決方案1 0 2017-05-22 01:39:01

解決方案2 0 2017-05-22 01:39:54

解決方案1
0 2017-05-22 01:39:01

解決方案2
0 2017-05-22 01:39:54