如何通過將最后一列分配為元組的第二個值來讀取csv文件？

Question

我在的csv文件中包含三列，因此每一行的格式為：

“ abcdef”“ uvwxyz” 0

我想生成一個元組列表，其中元組的第一個元素是從前兩列中提取的一些特征的字典，而第二個元素只是第三列（0或1值）的值，代表值的標簽特征。

我嘗試了以下操作，但是它拋出一些語法錯誤，說我在最后一行中未定義：

dataframe = pd.read_csv(csv_file, header = None, delimiter = "\t")
a = dataframe[0]
b = dataframe[1]
label = dataframe[2]
feature = [(findFeature(x,y), labels) for x,y in i for i, labels in  zip(zip(a,b), label)]

我哪里錯了？

Answer 1

看來您需要：

feature = [(findFeature(x,y), label) for x,y, label in zip(a,b,label)]

Answer 2

如果您不需要任何進一步的轉換，可以使用csv庫而不是pandas ：

import csv
with open(csv_file) as f:
    reader  = csv.reader(f)
    feature = [(findFeature(x,y), z) for x,y,z in reader]

您可以在此處找到csv包用法的示例

Answer 3

我猜您需要將此("abcdef", "uvwxyz", 0)轉換為("abcdef", 0, "uvwxyz") ：

with open(csv_file, "r") as f:
    dataframe = [(a,c,b) for a,b,c in map(lambda x: x.split("\t"), f)]

拆分每行並重新打包為(a,c,b)時a,b,c拆開元組a,b,c包裝

如何通過將最后一列分配為元組的第二個值來讀取csv文件？

問題描述

3 個解決方案

解決方案1
1 已采納 2017-06-19 07:49:33

解決方案2
0 2017-06-19 07:42:11

解決方案3
-1 2017-06-19 07:36:29

如何通過將最后一列分配為元組的第二個值來讀取csv文件？

問題描述

3 個解決方案

解決方案1 1 已采納 2017-06-19 07:49:33

解決方案2 0 2017-06-19 07:42:11

解決方案3 -1 2017-06-19 07:36:29

解決方案1
1 已采納 2017-06-19 07:49:33

解決方案2
0 2017-06-19 07:42:11

解決方案3
-1 2017-06-19 07:36:29