[英]Pandas, convert column of unicodes to column of list of strings
我的pandas数据框列中有一种此类的u'asd,abc,tre,der34,whatever'
。 最终结果应该是一列字符串列表: ['asd','abc','tre','der34','whatever']
。 Unicode列表也可以这样做: [u'asd',u'abc',u'tre',u'der34',u'whatever']
。
顺便说一下,tt可能会在unicodes列中出现nan或u''。
有什么建议吗? 我知道我可以做str(df['column'].iloc[0]).split(',')
并手动添加一个新列或做一些棘手的事情,但是我一直在寻找一些更pythonic的东西。
此解决方案似乎有效:
df['Column'] =df['Column'].astype(str).str.split(',')
这应该可以工作,如果有nan或空字符串,则您必须处理它,但您认为合适。
In [1]: [str(col) for col in u'asd,abc,tre,der34,whatever'.split(',')]
Out[1]: ['asd', 'abc', 'tre', 'der34', 'whatever']
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.