“數據挖掘”是由提取自組織的儲存或數據倉庫有價值的信息。數據挖掘方法的搜索模式,如果該數據包含損壞的掩蓋這些模式的值可能會受到影響。就會產生“垃圾進,垃圾出”的毫無意義的資料。
GritBot是一種自動的工具,試圖找到數據異常為先導,以數據挖掘。它可以被看作是一個獨立的數據質量審核員會尋找具有標稱值(離散)“令人驚訝”值的記錄和/或數字(連續)的屬性。
在完整的數據集- GritBot能搜索記錄中的異常明顯的子集。在下面的範例說明:GritBot確定了兩個女的年齡在70歲時作為是不正常的。這樣的年齡並不令人驚訝,但在整個人群中,但他們肯定是在這種情況下,因為女性被標記為懷孕,會被視為不正常的情況。
GritBot的特色:
- GritBot已被設計來分析大量的數據庫含有數十或數十萬的記錄和許多數字或名義字段。
- 這可能是異常值GritBot識別報告,以為什麼每個價值似乎令人驚訝的解釋起來。
- 所求出的圖案GritBot可以保存並用於檢查新的數據。在新數據中發現潛在異常可不同於最初確定異常的類型。
- GritBot幾乎是自動的-用戶不需要求統計或數據分析的知識。
- GritBot適用於windows XP / Vista / 7/8和 Linux。