簡體   English   中英

順序模式-數據挖掘

[英]Sequential Pattern - Data Mining

我是數據挖掘的新手,所以對這個問題對於任何人來說都是顯而易見的問題,我深表歉意。 我知道那里有很多數據挖掘算法,例如順序模式挖掘或先驗算法。 我想知道是否將我實現的以下代碼視為數據挖掘,特別是針對順序模式,如果我有一個大約有20,000名學生的數據庫,還是我必須專門使用一種現有的數據挖掘算法?

String x = "SELECT STUDENTS.ROW, STUDENTS.MAJOR, STUDENTS.NAME " +
"CASE WHEN prior_row.NAME IS NOT NULL" +
"AND EXISTS(SELECT 'x' FROM STUDENTS prior_row " +
"WHERE STUDENTS.MAJOR = prior_row.MAJOR" +
"AND STUDENTS.ROW > prior_row.ROW + 1" +
"SELECT STUDENTS.MAJOR, STUDENTS.ROW, STUDENTS.NAME WHERE" +
"MAJOR < (SELECT MAJOR FROM STUDENTS WHERE MAJOR = 'MATH' 
"AND WHERE MAJOR > (SELECT MAJOR FROM STUDENTS WHERE MAJOR = 'SCIENCE' THEN 1 ELSE NULL          END Flagged_Values";

 st.executeQuery(x);

  String y = "SELECT STUDENTS.ROW, STUDENTS.MAJOR, STUDENTS.NAME" +
"CASE WHEN previous.NAME IS NOT NULL" +
"AND EXISTS(SELECT 'y' FROM STUDENTS previous" +
"WHERE STUDENTS.MAJOR = previous.MAJOR" +
"AND STUDENTS.ROW > previous.ROW + 1" +
"SELECT STUDENTS.MAJOR, STUDENTS.ROW, STUDENTS.NAME WHERE" +
"MAJOR < (SELECT THE_OUTCOME FROM STUDENTINFO WHERE MAJOR ='Math' +
"AND WHERE MAJOR > (SELECT MAJOR FROM STUDENTS WHERE MAJOR = 'SCIENCE'" +
"AND WHERE MAJOR > (SELECT MAJOR FROM STUDENTS WHERE MAJOR = 'Engineering'
"THEN 1 ELSE NULL END Flag ";

 st.executeQuery(y);

您正在執行的是SQL select語句 投影,選擇和聚合。

您是否已閱讀Wikipedia上有關數據挖掘的文章

實際的數據挖掘任務是對大量數據進行自動或半自動分析,以提取以前未知的有趣模式,例如數據記錄組(集群分析),異常記錄(異常檢測)和依存關系(關聯規則挖掘)。 這通常涉及使用數據庫技術,例如空間索引。 然后,這些模式可以看作是輸入數據的一種摘要,並且可以用於進一步的分析中,或者例如用於機器學習和預測分析中。 例如,數據挖掘步驟可能會識別數據中的多個組,然后可以將這些組用於決策支持系統以獲得更准確的預測結果。 數據收集,數據准備,結果解釋和報告都不是數據挖掘步驟的一部分,但作為附加步驟,它確實屬於整個KDD流程。

術語“數據挖掘”經常被誤用於任何類型的數據收集或選擇,但是應該將這些任務稱為“數據收集”和“數據庫查詢”,而不是拉扯隨機的流行詞。 數據挖掘是統計,人工智能,機器學習和數據庫的交集 如果缺少這些組件(除了數據庫,在查詢中看不到它們),則應將其稱為“數據庫”,“機器學習”或“統計信息”。

通常,請記住,這本質上是基於意見的,數據挖掘是指獲取相對不可用格式的數據並將其轉換為更可用格式的過程。

例如,如果我有一個很大的非結構化文本.txt轉儲,然后提取相關部分(根據相關的正式定義),然后將其放入.bson存儲區或類似的存儲區中,那將是數據挖掘,無論確切地我如何提取。

但是,由於您的數據已經在SQL數據庫中,因此我不考慮這種數據挖掘。 我認為這是SQL開發,盡管再次,這很大程度上是基於意見的。 SQL數據庫已經是一種非常有用的數據存儲方式,因此訪問該數據並不會引入尚不存在的功能級別。

tl; dr:我不會說這算作數據挖掘,但這是一個灰色區域。

在數據挖掘領域,執行SQL查詢將不被視為數據挖掘。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM