清理數據中的Python問題

Question

這是我當前正在使用的代碼，相對來說我是python新手。 我試圖做的是使用rcid的子選擇來有條件地更改另一列。 文本文件包含我要更改的所有rcid值，並且我想將其應用於va_yes列。 嘗試此操作時，出現錯誤“ NameError：未定義名稱'rcid'”。 我已經嘗試了十年了，但是想一次全部清理完。

import numpy as np
import pandas as pd
df = pd.read_csv("C:\Users\Adini\Documents\opec_pooled.csv")

rcid_1 = []
with open('C:\\Users\Adini\Desktop\\1.txt','r') as f:
  mylist = f.read().splitlines()
  rcid_1.append(mylist)


for cells in rcid:
  for rcids in rcid_1:
      if(cells == rcids):
          df.ix[rcid == rcids, "va_yes"]= 1`

謝謝

Answer 1

我猜你的df有一個名為'rcid'的列，並且您希望添加一列'va_yes' ，如果rcid在1.txt ，則為1 ，否則為0 。

首先，請確保您已正確解析1.txt 。 由於您尚未上載該示例，因此我無法明確告訴您該怎么做，但是您會希望將rcids放在非嵌套列表中。 假設1.txt中的每一行都是一個rcid，則您需要的變量mylist是。

您已經正確加載了df ，並且可以在1行中分配'va_yes'列：

df['va_yes'] = df['rcid'].isin(mylist) * 1

清理數據中的Python問題

問題描述

1 個解決方案

解決方案1
0 2017-03-27 06:44:27

清理數據中的Python問題

問題描述

1 個解決方案

解決方案1 0 2017-03-27 06:44:27

解決方案1
0 2017-03-27 06:44:27