[英]How to manipulate data in a .csv file using Pandas and access specific row and column?
我有一个 .csv 文件,其中包含四列和大约 700000 行。 我的问题是我无法访问特定的单元格,而只能访问整行。 我的代码:
import pandas as pd
data = pd.read_csv("example.csv")
entries = data["entry"].astype(str)
payments = data["payment_type"].astype(str)
origins = data["origin"].astype(str)
for row in entries:
if row[26] == "Y":
data["payment_type"] = "sample"
if row[27] == "Y":
data["payment_type"] = "Check Card"
...
例如在.csv文件的第一行,我想根据同一行的“条目”列格式化“来源”列中的单元格。 该脚本执行此操作,但正如现在所写的那样,它根据最后一个条目的值来格式化整个列。 我认为我的问题出在“for”循环中,关于如何访问列的特定行。
任何帮助,将不胜感激。
先感谢您。
您可以使用np.where
function 并定义规则何时格式化与其匹配的行。 或者,如果您有多个规则和多个条件,则可以使用np.select
。
您正在替换整列,您必须为每一列添加行
import pandas as pd
data = pd.read_csv("example.csv")
entries = data["entry"].astype(str)
payments = data["payment_type"].astype(str)
origins = data["origin"].astype(str)
for row in entries:
if row[26] == "Y":
data["payment_type"][row] = "sample"
if row[27] == "Y":
data["payment_type"][row] = "Check Card"
...
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.