簡體   English   中英

使用J48解釋x級別中感興趣的划分屬性的結果(WEKA)

[英]Interpreting results using J48 for a divided attribute of interest in x levels (WEKA)

我是數據挖掘和Weka的新手。 我使用GUI在Weka中使用J48構建了一個分類器,並使用J48(訓練集)為五個級別的關注屬性創建了一個分類器。 我必須評估模型的精度,但是我不知道該怎么做! 一些信息可能令人感興趣:

== Detailed Accuracy By Class ===
Precision
0.80
?
0.67
0.56
?
?

首先, 我想知道“?”的含義。 在精度列中。 在兩個級別中使用感興趣的屬性進行探測時,我沒有得到“?”。 現在的樹比分成兩個層次時要大。 我懷疑這是否意味着在五個級別上采用感興趣的屬性是否會在分類和計算時間方面生成效率較低的樹。 當屬性具有2個級別時,正確分類實例的數量高達72%,這似乎非常明顯。

在此先感謝您,所有有趣的答案都將得到獎勵!

“我想知道精度列中“?”的含義”

請注意,對於這些相同的類別,TP和FP速率均為0。看來J48尚未將您的任何觀察分配給這些類別。

這些課程相對較少嗎? 如果是這樣,您可能要考慮使用ClassBalancer過濾器。 這將使用權重使所有類看起來都相同。

當然,獲得模型后,您需要“轉換回”實際情況。 這類似於校正物理過采樣或欠采樣。 在這里查看我的答案: https : //stats.stackexchange.com/questions/211174/how-to-exact-prediction-from-over-sampled-dataundoing-oversampling/257507#257507

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM