繁体   English   中英

Ruby PDF :: Reader与正则表达式匹配的要点

[英]Ruby PDF::Reader matching bullet point with Regex

我已经用PDF :: Reader在Ruby中解析了一个pdf文档。 pdf文件的项目符号点在我解析的文本中显示为一个内部带有F0B7的奇怪立方体,如下所示(我还附加了一个打印屏幕):

  __
 |F0|
 |B7|

我想知道我是否可以将此“子弹点”与正则表达式匹配,如果可以,那么合适的方法是什么? 我绝对不知道要解决这个问题,因为我什至不确定这是否是字符串的一部分。 谢谢。 在此处输入图片说明

这是一个带有代码点F0B7的unicode符号。

不幸的是,您的Ubuntu安装使用的默认字体缺少该字形,并且当字体定义中缺少字形时, 常用的方法是将其代码点绘制在一个正方形中。

匹配它的正则表达式为:

/\uF0B7/

在此处输入图片说明

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM