cost 269 ms
SolR 的數據導入處理程序跟蹤但忽略嵌套實體的更改

[英]SolR's Data Import Handler tracks but ignores nested entity's changes

我有兩個表,我試圖讓數據導入處理程序在子實體更改時更新文檔的索引。 當我觸發“delta-import”命令時,我得到以下信息: 我的數據配置是這樣的: 據我了解,“Total Rows Fetched”顯示子實體表中的 3 個條目已更改。 那么,為什么它不索引更改的字段呢? 如果我進行“完全導入” ...

2021-08-16 11:09:42   1   57    solr / dih  
當 MySQL 數據庫中沒有可用的最后插入時間時,Solr DIH 中的 8 個增量查詢

[英]Solr 8 delta query in DIH when there is no last insertion time available in MySQL database

我必須將一個大小約為 4TB 的數據庫導入 Apache SOlr 8. 數據庫是 MySQL,我加入了三個表以從 DB 中獲取一些信息。 Solr 在雲模式下運行。 使用本指南配置 Solr DIH 后,我能夠將數據完全導入 Solr。 我的第一個困惑: DIH 對這么大的數據有用嗎? 有沒有 ...

Linux 主機上的 Solr:數據導入處理程序的問題

[英]Solr on a Linux Host: Issue with the data Import Handler

我正在使用 Solr 數據導入處理程序對 SQL SERVER 2016 上的數據庫進行索引。 我目前正在研究 solr-8.6.3。 我最初在 Windows 10 上工作,在獨立模式下,我配置了架構、solrconfig 和 core-data-config(用於 dih)。 我上傳了使 di ...

Solr 數據導入處理程序 (DIH) 無法索引 MySQL 視圖中的所有記錄

[英]Solr Data Import Handler (DIH) fails to Index all the records from MySQL View

我在我的 MySQL DB 中有一個視圖,並使用 DIH 構建 Solr 索引的 POC。 在我的直接 select 查詢中,有 6 條記錄,但 Solr 查詢僅返回 4 條(盡管它確實說它已獲取 6 條記錄)。 MySql 查看 Select 從視圖 使用以下命令在 Solr 上運行 DIH ...

2020-04-22 15:35:45   1   68    solr / dih  
如何使用DIH命令觸發DIH導入

[英]How do I trigger a DIH import using DIH Commands

Solr的設置正確,我可以使用DIH數據導入處理程序手動導入數據-即使用用戶界面。 我在通過HTTP請求觸發導入時遇到了麻煩-是否有啟用此設置的設置,或者還有其他可能丟失的設置? 我只是點擊網址: 我不知道wny dataimport在URL中兩次,但是我只用一次嘗試過它,仍然無 ...

2019-07-25 09:42:20   1   27    solr / dih  
Solr:對具有空格的術語使用通配符

[英]Solr: Using wildcard for a term having whitespaces

我正在嘗試搜索一個末尾帶有空格和通配符的術語; 即name:John S* Solr無法返回任何結果,盡管我為以下條目建立了索引,並在從Solr Web界面查詢*:*時返回了它們; 約翰·道 約翰尼·英語 約翰·史密斯 我正在使用帶有DIH的Sol7.4和DI ...

SOLR DataImportHanlder (DIH) 完整索引 - 有時我們的索引在導入期間顯示接近零的文檔

[英]SOLR DataImportHanlder (DIH) Full Indexing - sometimes our index shows near-zero documents during import

我們正在運行 SOLR 7.2.1。 我們通過 DataImportHanlder(clear=true)定期更新我們的索引(完全重新索引)。 大多數情況下,當 DIH 運行時,我們索引中的正常文檔數量(通常約為 250,000)仍然可見(因為它直到導入結束才會提交)。 然而,我們偶爾會遇到一個 ...

2018-10-26 15:39:08   1   263    solr / dih  
Solr DIH終結點上出現“ ArrayList無法轉換為java.lang.String”錯誤消息

[英]“ArrayList cannot be cast to java.lang.String” error message on Solr DIH endpoints

我正在設置新的Solr服務器,遇到了以前的Solr安裝中未曾遇到的問題。 當我導航到核心的“數據導入”選項卡(甚至不觸發導入請求)時,管理UI發出的多個HTTP請求都會失敗。 檢查Solr日志,我看到以下堆棧跟蹤: 當我開始從管理界面導入數據時,或者實際上對/solr/<cor ...

Solr:使用DIH時,將托管架構更改為架構並在WINDOWS中添加新字段

[英]Solr: change managed schema to schema and add new field in WINDOWS when using DIH

我正在嘗試學習和創建用於文本搜索的SOLR搜索引擎。 我的第一步是將目錄從SQL加載到Solr。 我已經使用數據導入處理程序導入了數據,但是Solr僅加載了id字段。 后來我意識到托管模式不適用於DIH 。 因此,我目前正在將表單托管模式轉換為經典模式。 Solr學習資料要求我 ...

向ColdFusion 2016 Solr添加數據導入處理程序

[英]Adding Data Import Handlers to ColdFusion 2016 Solr

我正在嘗試從ACF 2016安裝隨附的Solr版本的MySQL數據庫中索引表。 Adobe的文檔指出,我需要使用Solr的數據導入處理程序來執行此操作,他們說這需要修改solrconfig.xml並創建data-config.xml文件。 這不能按原樣工作。 進一步閱讀使我相信我需要: ...

從Oracle數據庫導入XML數據時,Solr DIH變慢

[英]Solr DIH slows when importing XML data from Oracle database

我正在執行Solr DIH(DataImportHandler)任務,以導入存儲在Oracle數據庫中的大約2000萬個文檔。 最初,這些導入每秒將增加到500多個文檔,但在最初的150,000個文檔中,速度將崩潰至200以下,最終降為50-60 / s。 這時我的耐心就結束了,我殺死了這個 ...

Solr 6.2.0構面查詢響應返回分散的結果

[英]Solr 6.2.0 facet query response returning spitted results

我已經使用DIH從oracle DB創建了新的核心和索引目錄。 索引編制成功。 因此,現在我嘗試使用方面查詢來查詢以下內容。 這是我的數據結構已被索引。 所以我的查詢是。 localhost:8983/solr/TestCore/select?facet.field=categ ...

2018-02-15 11:58:19   2   63    solr / dih  
Solr:獲取DataImportHandler以忽略丟失的元素

[英]Solr: Get DataImportHandler to ignore missing elements

我正在嘗試使用DIH從我不維護的XML源中導入數據。 該XML具有分組為屬性的可選元素,例如顏色或風味。 並非所有實體都具有所有屬性,這是完全正確且有效的。 可悲的是,當我仍然需要這些實體時,DIH會跳過它們。 這是我的data-config.xml 如何告訴DIH至少忽略缺失的 ...

Apache Solr,SolrJ與用於解析XML的數據導入處理程序

[英]Apache Solr, SolrJ vs Data Import Handler for parsing XML

我希望使用Solr從XML文件解析的信息中運行搜索。 這些XML文件不是Solr的文檔格式,因此我必須解析它們並以這種方式獲取所需的字段。 我熟悉Java編程,並且想知道SolrJ是否比使用數據導入處理程序更簡單的方法。 我正在考慮遍歷我擁有的每個XML文件,並從每個文件解析我需要的字 ...

Solr增量導入的效率方面

[英]Efficiency aspect of delta import in solr

我有大約2100000行的數據。 完全導入所花費的時間約為2分鍾。 對於表中的任何更新,我正在使用增量導入來為更新編制索引。 增量導入所花費的時間為6分鍾。 考慮到效率方面,最好是完全導入而不是增量導入。 那么,增量導入的需求是什么? 有沒有更好的方法可以使用增量導入來提高效率? ...

2017-08-07 06:54:24   1   229    solr / dih  
DeltaImport獲取所有數據

[英]DeltaImport fetches all the data

我正在索引數據庫中的數據。 我正在使用增量導入來獲取最近更新的數據。 但是,我發現盡管更改僅適用於一行,但它要提取兩次整個數據並對其進行一次處理。 我的config.xml中給出了deltaquery: 大約有2100000行。 因此,它總是會導致大量內存消耗,從而導致 ...

2017-07-25 13:27:56   1   56    solr / dih  
在TikaEntity Processor中從Ftp服務器獲取文件時,Solr DIH問題。 如何將憑據傳遞給UrlDataSource?

[英]Solr DIH-Troubles When Getting Files From Ftp servers In TikaEntity Processor. How Can I pass credentials to UrlDataSource?

當我嘗試從ftp服務器獲取文件以使用tikaEntityProcessor提取一些元數據時遇到了一些麻煩。 我需要一種將一些憑據傳遞給UrlDataSource的方法。 誰能告訴我該怎么做? 值示例: 網址 : ftp://localhost/Oreilly.Merc ...

SolrCloud DIH性能

[英]SolrCloud DIH performance

得到了在SolrCloud中運行的Solr 6.4.2,並對索引性能存在一些疑問。 我正在使用MSSql作為MSSQL的數據源和最新的JDBC驅動程序。 當Solr作為獨立啟動時,我的DataImport以31250 docs / s運行當Solr作為SolrCloud(2個副本)啟 ...

使用DIH fullimport時如何保持索引中的更改?

[英]How can I keep changes in the index when I use DIH fullimport?

我正在使用Solr 6.5將文件從多個ftp文件索引到多個核心(每種類型的文檔都有一個核心,例如音頻文件,圖像,軟件,視頻和文檔)。 情況是,我這樣做是為了填充一個前端具有社交網絡方法的應用程序,其中每個用戶都可以無限制地添加新標簽或修改其他元數據。 因此,當我再次執行數據導入處理程 ...

2017-05-15 20:57:43   1   37    solr / dih  

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM