繁体   English   中英

将 PDF 转换为 .ipynb(从 PDF 恢复 Jupyter notebook)

[英]Convert PDF to .ipynb (recover Jupyter notebook from PDF)

我有一个从 Jupyter 笔记本创建的 PDF 文件,但 original.ipynb 文件丢失了。 是否有一些工具可以帮助将 PDF 转换为.ipynb?

这可能是不可能的,因为.ipynb 文件包含需要在 jupyter notebook 中执行的代码片段。所以最好的选择是尝试将 pdf 中的内容复制到 new.ipynb 文件并执行它。

PDF 到 Python 很简单,但需要几个步骤。 本质上,您必须将代码提取为文本格式,然后对其进行解析和清理以将其恢复为可执行格式。

  1. 将 PDF 保存为文本文件。 Adobe Acrobat 在这方面做得很好,但是有几个 Python PDF 库可以从任何 PDF 中提取文本。

  2. 解析文本以识别和捕获 Python 代码(作为文本字符串)

  3. 将 Python 文本字符串转换为 Python 令牌。

  4. 清理或整理 Python 代码以对其进行格式化,使其运行时不会因缩进而出现错误。 您可以使用 Python “黑色”模块或 PEP8 linter 来清理缩进。

有许多将 HTML 格式的 Python 解析为 Jupyter Notebook 格式的示例。 Spyder 和 VSCode linters 可以很好地修复缩进。

无法将 pdf 转换为 ipynd。 但是你可以使用谷歌镜头它会帮助你复制粘贴。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM