繁体   English   中英

从python数据框列检索字符串的一部分

[英]Retrieve part of a string from python dataframe column

我正在使用Yelp数据集,它是一个熊猫数据框。 每行包含有关业务的信息,每列涉及特定信息,例如消费者评分,类别,属性等。我特别想从数据框的属性列中提取信息。 每行中的属性字段包含多个元素,并且长度不同。 我正在附上图片以使其清晰。 属性栏图片

我想从属性单元格中提取以下信息:'RestaurantsPriceRange2:1'。 请注意,“ RestaurantsPriceRange2”的值在每一行中也有所不同,可能是1,2,3或4。我试图将每一行收集到一个列表中,但是列表的长度对于每一行都不同。

有人可以建议如何从属性列中选择所需的信息吗?

看起来属性也用逗号分隔。 您可以用逗号将大括号中的每个属性分开(请参阅如何用括号中的逗号进行分隔?有关可用作分隔符的RegEx,并用大括号替换括号),并读取属性和也将它们转换为数据框的一部分。 这样,您可以直接访问Restaurant Price Range

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM