簡體 English 中英

Java中高效的字符串搜索

[英]Efficient string searching in Java

原文 2017-12-08 08:33:32 4 3 java/ string/ performance/ search/ processing-efficiency

我正在處理兩個大數據列表，我需要有效地檢查兩者之間的匹配。 這是方案：

逐行讀取文件（此文件有100萬行）
對於每一行，請在字符串的ArrayList中檢查是否有匹配項（此ArrayList也有大量的元素）
如果找到匹配項，則用新值替換文件中的行

有什么想法可以解決效率問題嗎？ 顯然，循環訪問如此多的記錄是無效率的，而且過程繁重。

謝謝你的幫助！

UPDATE值得注意的是，我並不是特別要說我需要使用ArrayList，這只是我用於測試的東西。 任何有關更有效館藏的建議都將受到歡迎。

3 個解決方案

您可以考慮通過不同的線程部分讀取文件。 這里討論類似的問題。

您可以分塊地處理文本（例如x字節或一行），每個塊可以由不同的線程執行，即每個塊一個線程。

沒有更多細節（例如鍵的性質），很難確定，但是您可能會發現使用Bloom過濾器有助於最大程度地減少check within an ArrayList of strings whether it has a match 。

顯然，如果查找列表隨時間變化，這將無濟於事。

您可以在搜索列表之前使用Bloom篩選器進行預檢查，因為如果列表中不存在該鍵，它可以很快為您提供直接的no答案。 如果Bloom filter maybe說，您仍然需要搜索列表。

您應該使用HashMap，它大約為O（1），或者如果您的字符串有很多沖突，而不是需要使用TreeSet O（logN）或Bloom過濾器。

Java更高效的數組搜索

[英]Java more efficient array searching

Java搜索字符串

[英]Java searching a string

搜索並行字符串Java

[英]Searching a Parallel String Java

Java中的字符串搜索算法

[英]String searching algorithms in Java

Java通過字符串搜索

[英]Java Searching Through a String

在Java中搜索字符串

[英]Searching a string in java

在Hashmap中搜索字符串數組的有效方法

[英]Efficient way of searching String Array in Hashmap

搜索字符串與字節數組哪個更有效？

[英]Which is more efficient, searching on string vs bytearrays?

使用Map實現高效的搜索過程-Java

[英]using Map to implement efficient searching process - java

Java中搜索和排序算法的高效實現

[英]Efficient implementations of Searching & Sorting Algorithms in Java

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Java更高效的數組搜索 Java搜索字符串搜索並行字符串Java Java中的字符串搜索算法 Java通過字符串搜索在Java中搜索字符串在Hashmap中搜索字符串數組的有效方法搜索字符串與字節數組哪個更有效？使用Map實現高效的搜索過程-Java Java中搜索和排序算法的高效實現

相關標簽

Java中高效的字符串搜索

問題描述

3 個解決方案

解決方案1
0 2017-12-08 08:57:00

解決方案2
0 2017-12-08 08:59:21

解決方案3
0 2017-12-13 12:06:31

Java中高效的字符串搜索

問題描述

3 個解決方案

解決方案1 0 2017-12-08 08:57:00

解決方案2 0 2017-12-08 08:59:21

解決方案3 0 2017-12-13 12:06:31

解決方案1
0 2017-12-08 08:57:00

解決方案2
0 2017-12-08 08:59:21

解決方案3
0 2017-12-13 12:06:31