[英]Selecting rows with a given dtype from a mixed-dtype Series in Pandas
我有一個來自Excel電子表格的Pandas系列,該電子表格大多是浮動的,但是由於貨幣位於不同的語言環境中而導致一些字符串無法解析:
s = pd.Series(['1,23', '4.56,78', 1, 2.0, np.nan])
我只想選擇那些是字符串的項目,以便可以應用轉換:
s[s.apply(type) == str] = s[s.apply(type) == str].str.replace('.', '').str.replace(',', '.')
s.astype(float)
0 1.23
1 456.78
2 1.00
3 2.00
4 NaN
dtype: float64
但是我找不到一種好的(內置,向量化)行方式獲取或選擇dtypes的方法。 有沒有更好的辦法?
您可以使用str.translate
同時執行兩項操作(轉換,更改dtype):
pd.to_numeric(s.str.translate(str.maketrans({'.': '', ',': '.'}))).fillna(s)
0 1.23
1 456.78
2 1.00
3 2.00
4 NaN
dtype: float64
dtype
將為'float64'
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.