簡體   English   中英

使用javascript和html5存儲空間搜索大量文本

[英]searching a large amount of text using javascript and html5 storage

我有一個依靠html5脫機存儲功能的網絡應用程序,因此用戶無需互聯網即可訪問它。 該應用程序實質上只提供html頁面以及一點CSS和javascript。

我正在嘗試添加在這些頁面上提供的文本中搜索關鍵字的功能,但是由於不能保證該應用程序可以訪問服務器,因此需要能夠在客戶端執行這些搜索。

我的想法是,我可以將可搜索的文本存儲在瀏覽器的Web sql數據庫中,並通過javascript或通過瀏覽器的sql api執行搜索。 我對執行此操作的最佳方法有一些疑問:

1)我隱約記得有一篇文章是關於如何實現這樣的事情的,也許來自airbnb? 有人記得這樣的文章嗎?

2)文本為2,000,000多個單詞,因此我認為indexOf將在此數據大小下分解。 正則表達式是否有機會成立? 實施實際搜索有哪些選擇? (庫,算法等)如果我需要走這條路,有什么文章建議可以幫助理解字符串搜索算法的權衡?

好吧,我剛剛為您編寫了一個快速基准測試 ,但驚訝地發現您可能可以擺脫使用String.indexOf() 每次搜索約35毫秒,即每秒約30次搜索。

編輯: 更好的基准 似乎存在某種初始化延遲,但看起來indexOf相當快。 您可以嘗試使用基准測試,看看它是否適合您。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM