繁体   English   中英

摘要-文本排名算法

[英]Summarization-Text rank algorithm

使用文本排名算法进行摘要比 BERT 摘要有什么优势? 尽管两者都可以用作提取摘要方法,但文本排名有什么特别的优势吗?

TextRank 实现往往是轻量级的,即使在 memory 资源有限的情况下也可以快速运行,而BERT等转换器模型往往相当大,需要大量的 memory。 虽然TinyML社区在使 DL 模型在有限资源内运行的技术方面有着出色的工作,但对于某些用例来说可能存在资源优势。

一些 TextRank 实现可以通过添加语义关系来“指导”,人们可以将其视为一种先验结构,以丰富所使用的图 - 或者在某些情况下是结合人类在环方法的手段。 与纯粹基于数据训练的监督学习模型相比,这些模型具有优势。 即便如此,DL 也有类似的努力(例如,迁移学习主题的变体),变形金刚可能会从中受益。

另一个潜在的好处是TextRank方法往往更加透明,而转换器模型在可解释性方面可能具有挑战性。 有一些工具可以提供很大帮助,但在model 偏见和公平性数据伦理法规遵从性等方面,这种担忧变得很重要。

根据个人经验,虽然我是流行的 TextRank开源实现之一的首席提交者,但我只将其提取摘要功能用于需要“便宜且快速”解决方案的用例。 否则,我建议考虑更复杂的摘要方法。 例如,我建议密切关注 TextRank 的作者Rada Mihalcea和她在密歇根大学的研究生正在进行的研究。

在比较“哪种文本摘要方法效果更好?”方面。 我会指出抽象摘要方面的工作,特别是John Bohannon 等人最近的工作。 ,在入门 有关出色的示例,请查看他们的团队使用自然语言理解、知识图、抽象摘要等生成的 CV19 研究的“每日简报” 。Amy Heineike 在“解锁大量 COVID-19 论文、文章的机器,和对话”

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM