[英]Sentence extraction from paragraph
使用strtok
可以单独获得para中的每个tocken。
我想单独捕获页面中的所有句子,以便单独处理它们。
一个解决方案是我保持循环并检查每个字符,如果是的话.
然后我考虑句子完成所以存储在一些数据结构中。 I dont know which data structure is best suitable to store this
。 数组还是矢量?
有没有其他更好的方法或一些c ++类可用于这样做?
UPDATE
后来我想对句子中的否定采取行动。 意味着考虑not
, no
, nope
这样的关键词。 如果not
+ negative word
然后把它当作+ ve字。
在使用C ++时,存储字符串的最佳数据结构是std::string
类。 在std::vector<std::string>
存储多个字符串。 顺便说一下,不要使用strtok
,而是使用std::getline
。
但是当你正在进行文本操作,也许是国际文本操作时,你应该看一下ICU库。 在这种情况下,特别是icu::BreakIterator::createSentenceInstance
。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.