簡體 English 中英

如何在Solr中索引HDFS pdf文件？

[英]How to index HDFS pdf files in Solr?

原文 2015-04-02 09:11:52 8 1 hadoop/ indexing/ solr/ hdfs

hadoop jar jobjar / hadoop / hadoop-lws-job-1.2.0-0-0.jar com.lucidworks.hadoop.ingest.IngestJob -Dlww.commit.on.close = true -DcsvFieldMapping = 0 = id，1 = text -cls com.lucidworks.hadoop.ingest.CSVIngestMapper -c hdp1 -i /user/solr/data/csv/mydata.csv -of com.lucidworks.hadoop.io.LWMapRedOutputFormat -s http：// localhost：8983 / solr

我已經嘗試在命令中使用上面的代碼來執行PDF文件，但是我得到了不希望的輸出！

com.lucidworks.hadoop.ingest.CSVIngestMapper用於獨家CSV文件，因此“ PDF文件”是否與此類似？ 期待您的協助。

1 個解決方案

您應該使用DirectoryIngestMapper：

hadoop jar jobjar/hadoop/hadoop-lws-job-1.2.0-0-0.jar 
com.lucidworks.hadoop.ingest.IngestJob -Dlww.commit.on.close=true    
com.lucidworks.hadoop.ingest.DirectoryIngestMapper -c hdp1 -i 
/user/solr/data/pdf/*.pdf -of com.lucidworks.hadoop.io.LWMapRedOutputFormat -s 
http://localhost:8983/solr

假設/user/solr/data/pdf/*.pdf是您的pdf文件所在的位置。

如何將PDF文件從HDFS索引到Solr

[英]How to index pdf files from HDFS to Solr

MapReduceIndexerTool-在Solr中索引HDFS文件的最佳方法？

[英]MapReduceIndexerTool - Best way to index HDFS files in Solr?

如何使用Solr將文件發送到HDFS

[英]How to send files to HDFS using Solr

在HDFS-Solr中存儲索引文件

[英]Storing Index file in HDFS- Solr

使用Apache Solr導入或索引Hive / HDFS數據

[英]Import or Index Hive/HDFS data with Apache Solr

如何使用Solr索引目錄中的所有csv文件？

[英]How to index all csv files in a directory with Solr?

如何將文件復制到HDFS？

[英]How to copy files into HDFS?

如何將文件從HDFS復制到遠程HDFS

[英]How to copy files from HDFS to remote HDFS

solr可以直接讀取HDFS中存儲的文件嗎？

[英]Can solr read the files which are stored in HDFS directly?

如何將gzip文件移動到hdfs

[英]How to move gzip files to hdfs

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何將PDF文件從HDFS索引到Solr MapReduceIndexerTool-在Solr中索引HDFS文件的最佳方法？如何使用Solr將文件發送到HDFS 在HDFS-Solr中存儲索引文件使用Apache Solr導入或索引Hive / HDFS數據如何使用Solr索引目錄中的所有csv文件？如何將文件復制到HDFS？如何將文件從HDFS復制到遠程HDFS solr可以直接讀取HDFS中存儲的文件嗎？如何將gzip文件移動到hdfs

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM