繁体   English   中英

在 Newspaper3k 中使用外部文件

[英]Use external file with Newspaper3k

我正在执行一些抓取和总结任务,发现报纸非常适合我(大部分)的需求。 我有一系列 pdf 个文件,我还需要查看这些文件并执行类似的任务。 我可以找到其他应用程序打开并从中提取故事,希望直接将文本提供给报纸并让它做它的事情……然而,到目前为止我一直无法弄清楚如何做到这一点。 有什么建议么?

这是一个很棒的 package 可以解决你的困境:pymupdf,请参阅

https://pymupdf.readthedocs.io/en/latest/

然后运行:

import fitz

并按照文档。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM