大數據
大數據是指無法在一定時間內用常規軟體工具對其內容進行抓取、管理和處理的數據集合。大數據技術,是指從各種各樣類型的數據中,快速獲得有價值信息的能力。適用於大數據的技術,包括大規模並行處理(MPP)資料庫,數據挖掘,分散式檔案系統,分散式資料庫,雲計算平台,網際網路,和可擴展的存儲系統。數據分析
一般指通過商業智慧型(BI)工具進行分析過程,通常被理解為將企業中現有的數據轉化為知識,幫助企業做出明智的業務經營決策的工具。可以認為,是對商業信息的蒐集、管理和分析過程,目的是使企業的各級決策者獲得知識或洞察力(insight),促使他們做出對企業更有利的決策。一般由數據倉庫、在線上分析處理、數據挖掘、數據備份和恢復等部分組成。涉及到軟體、硬體、諮詢服務及套用,其基本體系結構包括數據倉庫、在線上分析處理和數據挖掘三個部分。商業大數據工具
一體機資料庫/數據倉庫:IBM PureData(Netezza), OracleExadata, SAP Hana等等
數據倉庫:
Teradata AsterData, EMC GreenPlum, HP Vertica 等等
數據集市:
QlikView、Tableau、Yonghong Data Mart等等