數據可視化技術包含以下幾個基本概念:
①數據空間:是由n維屬性和m個元素組成的數據集所構成的多維信息空間;
②數據開發:是指利用一定的算法和工具對數據進行定量的推演和計算;
③數據分析:指對多維數據進行切片、塊、旋轉等動作剖析數據,從而能多角度多側面觀察數據;
④數據可視化:是指將大型數據集中的數據以圖形圖像形式表示,并利用數據分析和開發工具發現其中未知信息的處理過程。
數據可視化已經提出了許多方法,這些方法根據其可視化的原理不同可以劃分為基于幾何的技術、面向像素技術、基于圖標的技術、基于層次的技術、基于圖像的技術和分布式技術等等。
數據采集
數據采集(有時縮寫為DAQ或DAS),又稱為“數據獲取”或“數據收集”,是指對現實世界進行采樣,以便產生可供計算機處理的數據的過程。通常,數據采集過程之中包括為了獲得所需信息,對于信號和波形進行采集并對它們加以處理的步驟。數據采集系統的組成元件當中包括用于將測量參數轉換成為電信號的傳感器,而這些電信號則是由數據采集硬件來負責獲取的。
數據分析
數據分析是指為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。數據分析與數據挖掘密切相關,但數據挖掘往往傾向于關注較大型的數據集,較少側重于推理,且常常采用的是最初為另外一種不同目的而采集的數據。在統計學領域,有些人將數據分析劃分為描述性統計分析、探索性數據分析以及驗證性數據分析;其中,探索性數據分析側重于在數據之中發現新的特征,而驗證性數據分析則側重于已有假設的證實或證偽。
數據分析的類型包括:
1)探索性數據分析:是指為了形成值得假設的檢驗而對數據進行分析的一種方法,是對傳統統計學假設檢驗手段的補充。
2)定性數據分析:又稱為“定性資料分析”、“定性研究”或者“質性研究資料分析”,是指對諸如詞語、照片、觀察結果之類的非數值型數據(或者說資料)的分析。
2010年后數據可視化工具基本以表格,圖形(chart),地圖等可視化元素為主,數據可進行過濾,鉆取,數據聯動,跳轉,高亮等分析手段做動態分析。
可視化工具可以提供多樣的數據展現形式,多樣的圖形渲染形式,豐富的人機交互方式,支持商業邏輯的動態腳本引擎等等。
不同于一般的Dashboard或者Reporting產品,永洪科技的BI前端是發現型的:交互手段豐富,分析功能強大。用戶可以進一步與數據互動(Interactive),過濾(Filter)、鉆取(Drill)、刷取(Brush)、關聯(Associate)、變換(Transform)等等技術,讓用戶能夠:掌握信息,發現問題,找到答案,并采取行動。
數據治理
數據治理涵蓋為特定組織機構之數據創建協調一致的企業級視圖(enterprise view)所需的人員、過程和技術,數據治理旨在:
1)增強決策制定過程中的一致性與信心
2)降低遭受監管罰款的風險
3)改善數據的安全性
4)最大限度地提高數據的創收潛力
5)指定信息質量責任
數據管理
數據管理,又稱為“數據資源管理”,包括所有與管理作為有價值資源的數據相關的學科領域。對于數據管理,DAMA所提出的正式定義是:“數據資源管理是指用于正確管理企業或機構整個數據生命周期需求的體系架構、政策、規范和操作程序的制定和執行過程”。這項定義相當寬泛,涵蓋了許多可能在技術上并不直接接觸低層數據管理工作(如關系數據庫管理)的職業。
數據挖掘
數據挖掘是指對大量數據加以分類整理并挑選出相關信息的過程。數據挖掘通常為商業智能組織和金融分析師所采用;不過,在科學領域,數據挖掘也越來越多地用于從現代實驗與觀察方法所產生的龐大數據集之中提取信息。
數據挖掘被描述為“從數據之中提取隱含的,先前未知的,潛在有用信息的非凡過程”,以及“從大型數據集或數據庫之中提取有用信息的科學”。與企業資源規劃相關的數據挖掘是指對大型交易數據集進行統計分析和邏輯分析,從中尋找可能有助于決策制定工作的模式的過程。