[英]Python issue in cleaning data
這是我當前正在使用的代碼,相對來說我是python新手。 我試圖做的是使用rcid的子選擇來有條件地更改另一列。 文本文件包含我要更改的所有rcid值,並且我想將其應用於va_yes列。 嘗試此操作時,出現錯誤“ NameError:未定義名稱'rcid'”。 我已經嘗試了十年了,但是想一次全部清理完。
import numpy as np
import pandas as pd
df = pd.read_csv("C:\Users\Adini\Documents\opec_pooled.csv")
rcid_1 = []
with open('C:\\Users\Adini\Desktop\\1.txt','r') as f:
mylist = f.read().splitlines()
rcid_1.append(mylist)
for cells in rcid:
for rcids in rcid_1:
if(cells == rcids):
df.ix[rcid == rcids, "va_yes"]= 1`
謝謝
我猜你的df
有一個名為'rcid'
的列,並且您希望添加一列'va_yes'
,如果rcid在1.txt
,則為1
,否則為0
。
首先,請確保您已正確解析1.txt
。 由於您尚未上載該示例,因此我無法明確告訴您該怎么做,但是您會希望將rcids放在非嵌套列表中。 假設1.txt
中的每一行都是一個rcid,則您需要的變量mylist
是。
您已經正確加載了df
,並且可以在1行中分配'va_yes'
列:
df['va_yes'] = df['rcid'].isin(mylist) * 1
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.