資料探勘(Data mining)是指從組織的資料庫中萃取資料的過程,這些資料通常被用來洞察該組織的營運模式和預設未發生之結果,並預測結果為今後的情況下以協助決策。
Cubist建立以規則為基礎的預測模型的輸出值,並與See5/C5.0產品互補。例如,See5 / C5.0可能歸類從一些處理為“高”,“中”或“低”的百分產率,而Cubist將輸出一個數字,如“7.3”。
Cubist是一個功能強大的工具,Cubist模型比那些一般的技術,如多元線性回歸得可以到更好的結果,同時也比神經網絡分析更容易理解。
重要的特色:
- Cubist已被設計來分析大量的數據庫包含成千上萬的記錄和幾十到幾千數字或名義字段。如果你已經使用神經網絡或類似的建模工具,你將位Cubist的速度感到驚訝!(Cubist還利用處理器多達八個內核中的一個或多個CPU(包括Intel Hyper-Threading)加快建立模型。)
- 為了最大限度地提高可解釋性,Cubist模型被表示為 規則的集合,其中每個規則具有相關聯的多變量線性模型。每當情況相匹配的規則的情況下,相關聯的模型用於計算預測值。
- Cubist可用於windows XP / Vista / 7/8和Linux作業系統。
- Cubist是易於使用,並且不相信的統計或機器學習先進的知識(
- RuleQuest提供C的原始碼,因此由Cubist構建的模型可以嵌入在組織自己的系統。
