開心生活站

位置:首頁 > IT科技 > 

數據的預處理包括什麼

IT科技1.63W

數據預處理(datapreprocessing)即是指在主要的處理以前對數據進行的一些處理。如對大部分地球物理面積性觀測數據在進行轉換或增強處理之前,首先將不規則分佈的測網經過插值轉換爲規則網的處理,以利於計算機的運算。另外,對於一些剖面測量數據,如地震資料預處理有垂直疊加、重排、加道頭、編輯、重新取樣、多路編輯等。

數據的預處理包括什麼

數據預處理的方法:

1、數據清理

數據清理例程通過填寫缺失的值、光滑噪聲數據、識別或刪除離羣點並解決不一致性來“清理”數據。主要是達到如下目標:格式標準化、異常數據清除、錯誤糾正、重複數據的清除等。

2、數據集成

數據集成例程將多個數據源中的數據結合起來並統一存儲,建立數據倉庫的過程實際上就是數據集成。

3、數據變換

通過平滑聚集,數據概化,規範化等方式將數據轉換成適用於數據挖掘的形式。

4、數據歸約

數據挖掘時往往數據量非常大,在少量數據上進行挖掘分析需要很長的時間,數據歸約技術可以用來得到數據集的歸約表示,它小得多,但仍然接近於保持原數據的完整性,並結果與歸約前結果相同或幾乎相同。

標籤:預處理