簡體   English   中英

nutch fetch 失敗並出現 java.lang.NumberFormatException

[英]nutch fetch is failing with java.lang.NumberFormatException

我在 Red Hat Enterprise Linux 版本 8.3 (Ootpa) 上運行 Nutch 1.18,帶有 Java openjdk 版本“1.8.0_275”

我遵循這些方向: https://cwiki.apache.org/confluence/display/NUTCH/NutchTutorial#NutchTutorial-Step-by-Step:Concepts

當我到達bin/nutch fetch $s1的步驟時,每次獲取都失敗了。 請參閱下面的 hadoop 日志中的示例錯誤。 它們都因 java.lang.NumberFormatException 而失敗。 我可以使用 curl 來檢查 URL 是否可以訪問,並且它們可以訪問。

任何意見,將不勝感激。

    at java.lang.NumberFormatException.forInputString(NumberFormatException.java:65)
    at java.lang.Integer.parseInt(Integer.java:583)
    at java.lang.Integer.parseInt(Integer.java:615)
    at org.apache.hadoop.conf.Configuration.getInt(Configuration.java:1486)
    at org.apache.nutch.protocol.http.api.HttpBase.setConf(HttpBase.java:212)
    at org.apache.nutch.protocol.http.Http.setConf(Http.java:52)
    at org.apache.nutch.plugin.Extension.getExtensionInstance(Extension.java:169)
    at org.apache.nutch.protocol.ProtocolFactory.getProtocolInstanceByExtension(ProtocolFactory.java:177)
    at org.apache.nutch.protocol.ProtocolFactory.getProtocol(ProtocolFactory.java:155)
    at org.apache.nutch.fetcher.FetcherThread.run(FetcherThread.java:308)```

堆棧(關鍵字:協議、http、配置、parseInt)已經告訴我們無法讀取配置屬性的某些 integer 值。 查看源代碼(HttpBase.java,第 212 行)時,很明顯它與配置屬性“http.timeout”有關:

<property>
  <name>http.timeout</name>
  <value>10000</value>
  <description>The default network timeout, in milliseconds.</description>
</property>

請驗證它是否配置正確 - integer 值和合理的時間跨度。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM