將for循環的輸出寫入python中的csv

Question

我打開一個名為Remarks_Drug.csv的csv，其中包含連續列中的產品名稱和映射文件名 。 我正在對產品列執行一些操作，以刪除+字符后的所有字符串內容。 從+字符中剝離字符串后，我將結果存儲在名為product_patterns的變量中。

現在我打開一個新的csv ，我想把for循環的輸出寫成兩列，第一列包含product_patterns ，第二列包含相應的filenames 。

我現在得到的輸出只是我正在尋找的output csv的最后一行。 我認為我沒有正確循環，因此product_patterns和filename的每一行都會附加在output csv文件中。

有人可以幫我這個。

附上以下代碼：

import csv


with open('Remarks_Drug.csv', newline='', encoding ='utf-8') as myFile:
    reader = csv.reader(myFile)
    for row in reader:
        product = row[0].lower()
        #print('K---'+ product)
        filename = row[1]
        product_patterns = ', '.join([i.split("+")[0].strip() for i in product.split(",")])


        #print(product_patterns, filename)

    with open ('drug_output100.csv', 'a') as csvfile:
        fieldnames = ['product_patterns', 'filename']
        print(fieldnames)
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
        print(writer)
        #writer.writeheader()
        writer.writerow({'product_patterns':product_patterns, 'filename':filename})

樣本輸入：

    Film-coated tablet + TERIFLUNOMIDE, 2011-07-18 - Received approval letter_EN.txt
    Film-coated tablet + VANDETANIB,             2013-12-14 RECD Eudralink_Caprelsa II-28 - RSI - 14.12.2017.txt
    Solution for injection + MenQuadTT, 395_EU001930-PIP01-16_2016-02-22.txt
    Solution for injection + INSULIN GLARGINE,  2017-11-4 Updated PR.txt
    Solution for injection + INSULIN GLARGINE + LIXISENATIDE,   2017 12 12 Email Approval Texts - SA1006-.txt

Answer 1

我希望這是對你的正確方式，如果不是，請告訴我，我們檢查。

import csv

with open('Remarks_Drug.csv') as myFile:
    reader = csv.reader(myFile)
    products_list = list()
    filenames_list = list()

    for row in reader:
        products_list.append(row[0].lower().split("+")[0].strip())
        filenames_list.append(row[1])

    for index, product in enumerate(products_list):
        with open ('drug_output100.csv', 'a') as csvfile:
            fieldnames = ['product_patterns', 'filename']
            print(fieldnames)
            writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
            print(writer)
            writer.writerow({'product_patterns':product, 'filename':filenames_list[index]})

打開Remarks_Drug.csv文件並創建兩個列表，其中存儲根據您的喜好精心設計的行值。
迭代產品列表並枚舉它，以便在文件名列表中使用索引。
打開輸出文件並將結果附加到其中。

您還可以使用pandas以更智能的方式更快地制作csv文件。

這里的熊貓解決方案：

import pandas as pd

def select_real_product(string_to_elaborate):
    return string_to_elaborate.split('+')[0].strip()

df = pd.read_csv("Remarks_Drug.csv", delimiter=',', names=("product", "filename"))

df['product'] = df['product'].apply(select_real_product)

df.to_csv("drug_output100.csv", sep=',', na_rep='empty',index_label=False, index=False)

Answer 2

import csv
import pandas as pd

with open('Remarks_Drug.csv', newline='', encoding ='utf-8') as myFile:
    reader = csv.reader(myFile)
    mydrug = []
    for row in reader:
        product = row[0].lower()
        #print('K---'+ product)
        filename = row[1]
        product_patterns = ', '.join([i.split("+")[0].strip() for i in product.split(",")])
        mydrug.append([product_patterns, filename])

#     print(mydrug)

    df = pd.DataFrame(mydrug, columns=['product_patterns', 'filename'])
    print(df)
    df.to_csv('drug_output100.csv', sep=',', index=False)

這利用了pandas圖書館。 如果您要使用panda處理大型csv文件，在性能和內存方面將非常方便和高效。 這只是上述的替代解決方案。

將for循環的輸出寫入python中的csv

問題描述

2 個解決方案

解決方案1
2 已采納 2019-02-27 08:27:21

解決方案2
2 2019-02-27 08:41:12

將for循環的輸出寫入python中的csv

問題描述

2 個解決方案

解決方案1 2 已采納 2019-02-27 08:27:21

解決方案2 2 2019-02-27 08:41:12

解決方案1
2 已采納 2019-02-27 08:27:21

解決方案2
2 2019-02-27 08:41:12