繁体   English   中英

使用深度学习技术的文本摘要

[英]Text summarization using deep learning techniques

我正在尝试总结属于法律领域的文本文档。

我指的是关于如何实现深度学习架构的网站 deeplearning.net。 我已经阅读了很多关于文档摘要(单文档和多文档)的研究论文,但我无法弄清楚每个文档的摘要是如何生成的。

训练完成后,网络会在测试阶段稳定下来。 因此,即使我知道在训练阶段学习的一组特征(我已经弄清楚了),也很难在测试期间找出每个特征的重要性(因为网络的权重向量是稳定的)我将尝试为每个文档生成摘要的阶段。

我试图弄清楚这一点很长一段时间,但它是徒劳的。

如果有人研究过它或对此有任何想法,请给我一些指示。 我真的很感谢你的帮助。 谢谢你。

我认为你需要更具体一点。 当你说“我无法弄清楚每个文档的摘要是如何生成的”时,你的意思是你不知道如何解释学习到的特征,或者你不了解算法? 此外,“深度学习技术”涵盖了非常广泛的模型——您实际尝试使用的是哪一个?

在一般情况下,深度学习模型不会学习人类无法理解的特征(尽管您当然可以尝试寻找给定输入与模型中相应激活之间的相关性)。 所以,如果这就是你要问的,那么真的没有好的答案。 如果您在理解您使用的模型时遇到困难,我可能可以帮助您 :-) 让我知道。

这是一个博客系列,从一开始就详细讨论了文本摘要的工作原理,最近的研究使用了基于 seq2seq 深度学习的模型,这个博客系列从解释这种架构开始,直到达到最新的研究方法

此外,这个repo收集了构建文本摘要模型的多个实现,它在 google colab 上运行这些模型,并将数据托管在 google drive 上,因此无论您的计算机有多强大,您都可以使用 google colab 这是一个免费系统进行训练你的深层模型

如果您想查看实际的文本摘要,可以使用这个免费的 api

我真的希望这会有所帮助

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM