簡體   English   中英

如何通過nutch查看存儲在hbase中的hbase數據

[英]How to view hbase data stored in hbase by nutch

我正在使用Apache Nutch將數據存儲在使用hdfs作為其文件系統的hbase中。 我想知道它存儲在hbase等文件中。如何從hbase讀取數據,例如一些pdf存儲在hbase中。 我想讀。 我將如何做。

請指導我?

網頁和文檔存儲為一行。 如果知道您的文檔鏈接,則可以在hbase shell或其他工具(蜂巢豬等)上獲取它。Nutch將URL存儲為反向URL。

例如,“ http://bar.foo.com:8983/to/index.html?a=b ”變為“ com.foo.bar:8983:http/to/index.html?a=b”。

有關Hbase Shell的信息http://wiki.apache.org/hadoop/Hbase/Shell

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM