如何在不使用 pandas dataframe 的情況下從 CSV 文件中提取列值列表

Question

所以，我的最終目標是將此代碼集成到 AWS Lambda 中，因此我想盡可能避免使用 pandas。 這是我如何閱讀 CSV 文件（來自 S3）：

import boto3
s3 = boto3.client('s3')
    
bucket_name = #getting the bucket name
file_key = #getting the file key

obj = s3.get_object(Bucket=bucket_name, Key=file_key)

現在我如何使用obj （基本上是一個.csv 文件）來獲取包含 csv 的col1列中所有值的列表？

Answer 1

嘗試以下（只需將 f.read() 替換為從 s3 讀取）

with open('Names.csv') as f:
    col1 = []
    obj = f.read()  # TODO read from s3
    lines = obj.split('\n')[1:]
    for line in lines:
        x = line.split(',')[0]
        if x:
            col1.append(x)
print(col1)

名稱.csv

No,Name,Country
1,Alex,['India']
2,Ben,['USA']
11,Alex12,"['India', 'Italy']"

output

['1', '2', '11']

如何在不使用 pandas dataframe 的情況下從 CSV 文件中提取列值列表

問題描述

1 個解決方案

解決方案1
0 2021-03-10 14:22:44

如何在不使用 pandas dataframe 的情況下從 CSV 文件中提取列值列表

問題描述

1 個解決方案

解決方案1 0 2021-03-10 14:22:44

解決方案1
0 2021-03-10 14:22:44