[英]How to efficiently read only strings from a big txt file
我有一個很大的.txt文件(9 MB)。 其中的單詞存儲如下:
да 2337093
е 1504540
не 1480296
се 1212312
.txt文件中的每一行都包含一個字符串,后跟一個空格和一個數字。
我只想獲取單詞並將它們存儲在字符串數組中。 我看到一個正則表達式在這里會顯得過於矯kill過正,但是由於我對C ++中的流不熟悉,所以無法想到另一種方法。
類似於以下示例
#include <bits/stdc++.h>
using namespace std;
int main() {
vector<string> strings;
ifstream file("path_to_file");
string line;
while (getline(file, line))
strings.push_back(line.substr(0, line.find(" ")));
// Do whatever you want with 'strings' vector
}
您應該逐行讀取文件,並且對於每一行,請使用字符串的substr()
方法根據空間位置來解析行,並且可以使用find()
方法來查找定界符的位置。 采取在空間之前的部分這個詞,而忽略休息。
您可以在此處查看示例。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.