繁体   English   中英

python,yaml如何解析包含撇号的字符串

[英]python, yaml how to parse a string containing apostrophe

我正在使用python解析YAML文件。

YAML文档之一包含一个字典,例如:

scrapers:
    results: //article[@class='story ']

这显然引起了问题,因为最后一个撇号前面是空白。 如果我可以删除空白,它将解决问题。 但是,由于它是xpath,所以我不能。

有人知道我怎么能逃脱那个顺序吗? 我调查了其他的SO问题,但是解决方案例如将字符串包装在“”中,或者使用

scrapers:
  results: //article[@class='story ']

要么

scrapers:>
  results: //article[@class='story ']

要么

scrapers:
  results: //article[@class='story '']

不工作。

编辑:我正在尝试打开包含上述表达式的文件:

import yaml
with open('/home/depot/wintergreen/yaml/scrapers.yml', 'r') as f:
    scrapers = yaml.load(f)

但是我收到错误:ScannerError:此处不允许映射值

指着story后的空白。 我一直在尝试下面的回答者提供的建议,即从python dict创建yaml表达式。 这可行。 我将yaml保存到文件中,然后再次加载回它,它也可以正常工作。 但是,当我通过键入完全相同的字符来创建Yaml时,则它不起作用...

EDIT2:我认为问题源于我在窗口计算机上创建yaml文件并将其上传到unix服务器的事实。

为结构找到正确的YAML格式很容易:在Python中创建结构,然后使用yaml.dump创建YAML编码的字符串:

d = {'scrapers': {'results': "//article[@class='story ']"}}
print d

import yaml
print yaml.dump(d, default_flow_style=False)

其结果是:

{'scrapers': {'results': "//article[@class='story '"}}

scrapers:
    results: //article[@class='story ']

这是正确的YAML表示形式,因此,如果您遇到问题,则由解析器决定,而不是输入文本。 如果您使用标准的yaml库,则应该可以解析。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM