Lucene-如何使用TeeSinkTokenFilter？

Question

誰能解釋從Lucene使用TeeSinkTokenFilter的方式（以及用途）？ 一個例子也將不勝感激= P。 我發現官方文檔不太清楚，並且還查找了許多站點，但進展不大。 謝謝。

Answer 1

是的，我也不認為官方文檔非常清楚。 我認為讓它如此混亂的部分原因在於，它以難以區分的方式展示了兩個不同的功能。 讓我看看是否可以重寫他們的示例以僅顯示基本情況。

TeeSinkTokenFilter source1 = new TeeSinkTokenFilter(
    new WhitespaceTokenizer(version, reader1));
TeeSinkTokenFilter.SinkTokenStream sink1 = source1.newSinkTokenStream();
TeeSinkTokenFilter.SinkTokenStream sink2 = source1.newSinkTokenStream();
source1.consumeAllTokens(); // all tokens get cached at this point

TokenStream final3 = new EntityDetect(sink1);
TokenStream final4 = new URLDetect(sink2);

d.add(new TextField("f3", final3, Field.Store.NO));
d.add(new TextField("f4", final4, Field.Store.NO));

這允許final3和final4令牌流共享source1完成的處理。 如官方文檔所述，流的使用順序很重要，但並未說明，順序似乎不確定（或字段名稱按字母順序排列）。 我建議像上面所做的那樣使用consumeAllTokens方法。

Lucene-如何使用TeeSinkTokenFilter？

問題描述

1 個解決方案

解決方案1
0 2013-12-05 18:44:52

Lucene-如何使用TeeSinkTokenFilter？

問題描述

1 個解決方案

解決方案1 0 2013-12-05 18:44:52

解決方案1
0 2013-12-05 18:44:52