簡體   English   中英

py-datatable 用 NaN 替換列中的空字符串

[英]py-datatable Replace empty string in column with NaN

在 python 數據表中,我想用 NaN 替換空字符串。 當我嘗試時,我收到以下錯誤。 它適用於 pandas。 在此先感謝您的幫助。

我試過的數據表語法:

dt[:,"column_name"].replace('',np.nan)

收到錯誤:

無法將字符串值''替換為 <class 'float'> 類型的值

有效的 pandas 語法:

pd["column_name"]=pd["column_name"].replace('',np.nan)

Py 數據表語法根據其值更新(替換)其中一列:

import datatable as dt
mydt = dt.Frame(a=['a','b','c','','d','e'])
mydt[dt.f.a == '', dt.update(a = None)]

更新前的數據表:

mydt
   | a 
-- + --
 0 | a 
 1 | b 
 2 | c 
 3 |   
 4 | d 
 5 | e 

更新后的數據表:

mydt
   | a 
-- + --
 0 | a 
 1 | b 
 2 | c 
 3 | NA
 4 | d 
 5 | e 

適用於 0.10.0 或更高版本

獎勵答案:要完成相反的操作 - 用一些常數值替換缺失值,使用 function isna isna()

mydt = dt.Frame(a=['a','b','c', None,'d','e'])
mydt[dt.isna(dt.f.a), dt.update(a = 'NULL')]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM