簡體   English   中英

如何在不使用 pandas dataframe 的情況下從 CSV 文件中提取列值列表

[英]How to extract a list of column values from a CSV file without using a pandas dataframe

所以,我的最終目標是將此代碼集成到 AWS Lambda 中,因此我想盡可能避免使用 pandas。 這是我如何閱讀 CSV 文件(來自 S3):

import boto3
s3 = boto3.client('s3')
    
bucket_name = #getting the bucket name
file_key = #getting the file key

obj = s3.get_object(Bucket=bucket_name, Key=file_key)

現在我如何使用obj (基本上是一個.csv 文件)來獲取包含 csv 的col1列中所有值的列表?

嘗試以下(只需將 f.read() 替換為從 s3 讀取)

with open('Names.csv') as f:
    col1 = []
    obj = f.read()  # TODO read from s3
    lines = obj.split('\n')[1:]
    for line in lines:
        x = line.split(',')[0]
        if x:
            col1.append(x)
print(col1)

名稱.csv

No,Name,Country
1,Alex,['India']
2,Ben,['USA']
11,Alex12,"['India', 'Italy']"

output

['1', '2', '11']

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM