繁体   English   中英

在熊猫中,如何根据条件从另一个部分中创建一个新列?

[英]In pandas how to create a new column from part of another, obeying a condition?

在python 3和pandas中,我有数据框:

lista_projetos.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 59 entries, 0 to 58
Data columns (total 14 columns):
n_projeto                             59 non-null object
autor                                 59 non-null object
ementa                                59 non-null object
resumo                                59 non-null object
votacao_nominal                       59 non-null object
votacao_nominal_alternativa_emenda    59 non-null object
link_votacao                          0 non-null float64
observacao                            0 non-null float64
link_emenda                           0 non-null float64
indicado_por                          59 non-null object
entidade_que_avalia                   59 non-null object
favoravel_desfavoravel_indiferente    59 non-null object
explicacao                            59 non-null object
link_projeto                          59 non-null object
dtypes: float64(3), object(11)
memory usage: 6.5+ KB

“ link_projeto”列中的网址始终采用以下格式:

http://www.camara.gov.br/proposicoesWeb/fichadetramitacao?idProposicao=2171854

http://www.camara.gov.br/proposicoesWeb/fichadetramitacao?idProposicao=2147513

http://www.camara.gov.br/proposicoesWeb/fichadetramitacao?idProposicao=2168253

我想从“ link_projeto”列中创建一个新列。 因此:请务必在“ =”符号后选择最终数字

像这样:

new_column
2171854
2147513
2168253

请问,有没有一种方法可以从另一部分中创建一个新列?

首先,您将如何对单个值执行此操作?

>>> link = "http://www.camara.gov.br/proposicoesWeb/fichadetramitacao?idProposicao=2171854"
>>> link.split("=", 1)[1]
'2171854'

但是split是对str对象的一种方法。 如何将其应用于充满字符串的列? 简单:列(“系列”和“索引”)具有str属性 ,正是出于这个目的:

df.link_projecto.str.split("=", 1)

但是split不仅返回字符串,还返回字符串列表。 我们如何获得最后一个?

拆分和替换字符串中所述 ,您只需再次访问str并对其进行索引:

df.link_projecto.str.split("=", 1).str[1]

所以:

df["new_column"] = df.link_projecto.str.split("=", 1).str[1]

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM