[英]SOLR POST files with no extension
我正在使用SOLR 5,並且想掃描沒有擴展名的文檔。 不幸的是,就我而言,將文件更改為具有擴展名不是一種選擇。
我使用的命令很簡單:
$bin/post -c mycore ../foldertobescaned -type application/pdf
該命令適用於具有擴展名的文檔,但我得到:
進入自動模式。 考慮的文件結尾是xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
如果不能重命名文件,則可以使用以下腳本作為變通辦法,直到Solr改進其post方法。 這是一個簡單的bash for循環,可單獨提交每個文件,並且無論文件擴展名如何都可以工作。 請注意,此腳本要比在整個文件夾上使用post慢,因為每個文件傳輸都需要初始化。
下面保存作為腳本postFolderToSolr.sh
您Solr的文件夾中(這樣Solrs bin/
文件夾是一個子目錄),使其可執行與chmod +x postFolderToSolr.sh
,然后用它如下: ./postFolderToSolr.sh mycore /home/user1/foldertobescaned/ application/pdf
不使用任何參數或參數數量錯誤會打印一條簡短的用法消息作為幫助。
#!/bin/bash
set -o nounset
if [ "$#" -ne 3 ]
then
echo "Post contents of a folder to Solr."
echo
echo "Usage: postFolderToSolr.sh <colletionName> </path/to/folder> <MIME>"
echo
exit 1
fi
collection=$1
inputPath=${2%/} # remove suffix / if it exists
mime=$3
for element in $inputPath"/"*; do
bin/post -c $collection -type $mime $element
done
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.