使用 python 从嵌套字典的值中提取特定文本

Question

我有以下数据结构，我需要用state 密钥的[ft,mi,FT,MI]提取单词并存储在一个名为distance的新密钥中。

我的数据的可重现示例

[
    {
        "id": 1243,
        "class1": [
            {"count":5,
                "state": "Arizona 4.47ft"
            },
            {
                "state": "Georgia 1023mi"
            }
        ]
    },
    {
        "id": 12438,
        "class1": [
            {"count":2,
                "state": "Newyork 2022 NY 74.6 FT"
            },
            {
                "state": "Indiana 747MI(In)"
            },
            {"count":2,
                "state": "Florida 453mi FL"
            }
        ]
    }
]

预期 output 的迷你 exp：

[
    {
        "id": 1243,
        "class1": [
            {"count":5,
                "state": "Arizona 4.47ft",
                "distance":"4.47ft"
            },
            {
                "state": "Georgia 1023 mi",
                "distance":"1023 mi"
            }
        ]
    }]

我建立的逻辑：

   for a in df['state']:
    for k in a:
        if "state" in k:
            m = ["ft","mi","FT","MI"]
            df['distance']=df['state'].str.extract(r'(\S+\s?(?:%s))\b' % '|'.join(m))

感谢您的宝贵时间，祝您有美好的一天！

Answer 1

请查看创建“距离”并从正则表达式模式“(.*)”获取值的代码。

import re

pattern = " (.*)"

for a in data:
    for k in a:
        #print(k)
        if "class" in k:
            #print(a[k])
            for l in a[k]:
                #print(l)
                m = re.findall(pattern, l['state'])
                l['distance'] = m[0]
                #print(l)
    print(a)

output：

如果它没有提供正确的数据，您可以编辑正则表达式模式。

使用 python 从嵌套字典的值中提取特定文本

问题描述

1 个解决方案

解决方案1
-1 2022-03-30 15:04:18

使用 python 从嵌套字典的值中提取特定文本

问题描述

1 个解决方案

解决方案1 -1 2022-03-30 15:04:18

解决方案1
-1 2022-03-30 15:04:18