[英]How to efficiently read only strings from a big txt file
我有一个很大的.txt文件(9 MB)。 其中的单词存储如下:
да 2337093
е 1504540
не 1480296
се 1212312
.txt文件中的每一行都包含一个字符串,后跟一个空格和一个数字。
我只想获取单词并将它们存储在字符串数组中。 我看到一个正则表达式在这里会显得过于矫kill过正,但是由于我对C ++中的流不熟悉,所以无法想到另一种方法。
类似于以下示例
#include <bits/stdc++.h>
using namespace std;
int main() {
vector<string> strings;
ifstream file("path_to_file");
string line;
while (getline(file, line))
strings.push_back(line.substr(0, line.find(" ")));
// Do whatever you want with 'strings' vector
}
您应该逐行读取文件,并且对于每一行,请使用字符串的substr()
方法根据空间位置来解析行,并且可以使用find()
方法来查找定界符的位置。 采取在空间之前的部分这个词,而忽略休息。
您可以在此处查看示例。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.