簡體   English   中英

如何去除 Pandas 系列中的所有非數字字符

[英]How can I strip off all non-numeric characters in a Pandas Series

我有一個 Pandas DataFrame。 我有興趣獲得只有數字字符的特定列。

例如,該列包含如下行:

4'> delay trip
4/
4'>book flight 'trip
34
4"> book flight delay
4"

如何去除所有非數字字符而只有這樣的數字字符:

4
4
4
[3,4]
4
4

你在這里有兩個不同的問題:

  • 首先是從列單元格中提取數字
  • 第二個是如果你有一個以上的數字就做一個清單

只需鏈接兩個操作:

df[col].str.findall(r'\d').apply(lambda x: x[0] if len(x) == 1 else '' if len(x) == 0 else x)

用你的例子它給出:

0         4
1         4
2         4
3    [3, 4]
4         4
5         4

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM