簡體   English   中英

Tika和Solr Drupal 7在Cron上的索引

[英]Tika and Solr Drupal 7 Indexing on Cron

我們試圖使用Drupal / Search API模塊/ Solr / Tika來索引大量文件。

我已經設置了索引,並且一切正常,直到包括Search API附件模塊為止。

當我們運行cron時,不會調用tika 我們之所以知道這一點,是因為我們在tika模塊的末尾插入了一段PHP代碼以寫入系統日志,並且該消息永不顯示。 手動運行索引時會顯示它。

此外,cron運行后,項數索引不會增加。

我們還注意到,如果我們從命令行運行tika,則會在輸出的頂部得到以下錯誤:INFO-不支持/禁用的操作:EI

索引可以按預期工作,而無需選中在cron上以及通過手動索引對附件進行索引的框。

知道可能是什么問題嗎?

謝謝!

網站建立於:

  • Drupal 7

有問題的模塊:

  • 搜索API
  • 搜索API附件

索引:

  • 阿帕奇·索爾(Apache Solr)

使用以下方法索引附件:

  • 蒂卡圖書館

我也有同樣的問題。 但這似乎根本不是問題,因為無論如何該文檔似乎都已建立索引。

我猜這是一個Tika問題,因為某些文檔(pdf)運行良好,而其他文檔則無法正常運行。 也許取決於pdf版本。 嘗試一些更簡單的方法。 IE瀏覽器我編寫了示例文本,並在Mac上使用了“打印到pdf”功能以獲取簡單的pdf文檔。 或使用Word文檔。 我們還必須應用真實路徑補丁才能使Tika使用文件...以及音譯模塊具有清晰的文件名。 為了調試search_api,我使用了devel的dd()函數。 在search_api_solr / includes / solr_httptransport.inc performHttpRequest()中,我叫dd($url); dd($options); dd($url); dd($options); 就在$response = drupal_http_request($url, $options); (line:92)...希望這會有所幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM