簡體   English   中英

清理數據中的Python問題

[英]Python issue in cleaning data

這是我當前正在使用的代碼,相對來說我是python新手。 我試圖做的是使用rcid的子選擇來有條件地更改另一列。 文本文件包含我要更改的所有rcid值,並且我想將其應用於va_yes列。 嘗試此操作時,出現錯誤“ NameError:未定義名稱'rcid'”。 我已經嘗試了十年了,但是想一次全部清理完。

import numpy as np
import pandas as pd
df = pd.read_csv("C:\Users\Adini\Documents\opec_pooled.csv")

rcid_1 = []
with open('C:\\Users\Adini\Desktop\\1.txt','r') as f:
  mylist = f.read().splitlines()
  rcid_1.append(mylist)


for cells in rcid:
  for rcids in rcid_1:
      if(cells == rcids):
          df.ix[rcid == rcids, "va_yes"]= 1`

謝謝

我猜你的df有一個名為'rcid'的列,並且您希望添加一列'va_yes' ,如果rcid在1.txt ,則為1 ,否則為0

首先,請確保您已正確解析1.txt 由於您尚未上載該示例,因此我無法明確告訴您該怎么做,但是您會希望將rcids放在非嵌套列表中。 假設1.txt中的每一行都是一個rcid,則您需要的變量mylist是。

您已經正確加載了df ,並且可以在1行中分配'va_yes'列:

df['va_yes'] = df['rcid'].isin(mylist) * 1

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM