繁体   English   中英

从段落中提取句子

[英]Sentence extraction from paragraph

使用strtok可以单独获得para中的每个tocken。

我想单独捕获页面中的所有句子,以便单独处理它们。

一个解决方案是我保持循环并检查每个字符,如果是的话. 然后我考虑句子完成所以存储在一些数据结构中。 I dont know which data structure is best suitable to store this 数组还是矢量?

有没有其他更好的方法或一些c ++类可用于这样做?

UPDATE

后来我想对句子中的否定采取行动。 意味着考虑notnonope这样的关键词。 如果not + negative word然后把它当作+ ve字。

在使用C ++时,存储字符串的最佳数据结构是std::string类。 std::vector<std::string>存储多个字符串。 顺便说一下,不要使用strtok ,而是使用std::getline

但是当你正在进行文本操作,也许是国际文本操作时,你应该看一下ICU库。 在这种情况下,特别是icu::BreakIterator::createSentenceInstance

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM