繁体   English   中英

Python Pandas 根据格式替换字符串

[英]Python Pandas replace string based on format

请问,有什么方法可以将数据框中每一行中的“xy”替换为“x,x+1,x+2,...,y” (其中 x、y 是整数)。 例如,我想像这样替换每一行:

“1-3,7”由“1,2,3,7”
"1,4,6-9,11-13,5" 由 "1,4,6,7,8,9,11,12,13,5" 等

我知道通过循环遍历行并使用正则表达式我们可以做到这一点。 但是桌子很大,需要相当长的时间。 所以我认为使用熊猫可能会更快。

非常感谢

在 Pandas 中,您可以使用apply将任何函数应用于 DataFrame 中的行或列。 该函数可以通过 lambda 传递,也可以单独定义。

(旁注:您的示例并没有完全说明您实际上有一个 2-D DataFrame 还是只有一个 1-D 系列。无论哪种方式,都可以使用apply

下一步是找到正确的函数。 这是一个粗略的版本(没有正则表达式):

def make_list(str):
    lst = str.split(',')
    newlst = []
    for i in lst:
        if "-" in i:
            newlst.extend(range(*[int(j) for j in i.split("-")]))
        else:
            newlst.append(int(i))
    return newlst

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM