greenplum和hadoop對比,mpp數據庫有哪些

前段時間在網上看到一張大數據行業全景圖,幾乎涵蓋了大數據相關的全部技術。光數據庫產品就好幾十種,真是眼花繚亂:)

數據庫的分類有哪些

先說說幾個概念:結構化和非結構化數據,關係型和非關係型數據庫

簡單而言,可以用二維表來表示的就是結構化數據(如,包含有不同字段的一條記錄);相反,不方便用二維邏輯表來表現的數據,如文本、圖片、視頻、XML、HTML、圖像和音頻就是非結構化數據。此外,字段可根據需要擴充,即字段數目不定的,可稱為半結構化數據。

關係型數據庫就是由二維表及其之間的聯繫所組成的一個數據集。可以這樣理解,如果數據集(數據庫)是關係型,那麼數據一定是結構化的,相反如果數據是結構化,那麼組成的數據集可能是關係型。關係型數據庫的最大特點就是事務的一致性。傳統的關係型數據庫讀寫操作都是事務的,具有ACID(不展開講)的特點,如典型的銀行系統。但是,在互聯網應用中,一致性卻不是顯得那麼重要:如張三看到的內容和李四看到同一內容更新不一致是可以容忍的,換句話說,兩個人看到同一好友的數據更新的時間差那麼幾秒是可以容忍的。因此,關係型數據庫的最大特點在互聯網時代已經不那麼重要了。

1、關係型數據庫

數據庫發展的早期,幾乎都是集中式的關係型數據庫的天下,如商業型數據庫ORACLE、SQL Server、IBM DB2、Sybase等,尤其是ORACLE,幾乎佔到了大型數據庫市場份額的70%以上,這也是為什麼「去IOE」(IBM的小型機、Oracle的數據庫、EMC的存儲)工作中去O最難的原因。

後來逐漸發展起來的開源數據庫有MySQL、PostgreSQL。據統計,截止2016年11月份,MySQL已超過Oracle數據庫,位居關係型數據庫排行榜第一。互聯網行業如谷歌、FaceBook、阿里、騰訊、京東等,傳統行業如順豐、圓通、上港集團、陸港集團、上汽集團、上交所、寧波銀行、恆豐銀行、聯通、移動、電信等,都有大規模應用MySQL。PostgreSQL主要在GIS領域處於優勢地位,有豐富的GIS數據類型和處理算法。

2、非關係型數據庫(NoSQL):大部分都是開源的,可謂百花齊放百家爭鳴,常見的產品超過20種。其中有很大一部分非關係型數據庫都是針對某些特定的應用需求出現的,因此,對於特定應用具有極高的性能。

非關係型數據庫主要分為以下幾類:

(1)鍵值(key-value)數據庫:面向高性能並發讀寫,典型代表如Redis。

(2)列存儲(Columnar Storage)數據庫:面向PB級的分析應用,如:HBase,Hypertable。京東、阿里、騰訊、唯品會、圓通、順豐等都將HBase大規模應用於准實時的數據分析挖掘計算以及提供歷史歸檔數據的存儲和查詢服務。

(3)文檔數據庫:特點是可以在海量的數據中快速地查詢數據,如網頁和移動應用數據。典型代表:MongoDB,CouchDB,Mark Logic

(4)圖形數據庫:如應用在推薦系統、關係圖譜,典型代表:new4j,InfiniteGraph,OrientDB

3、新式關係型數據庫(NewSQL ):NewSQL提供與NoSQL系統相同的擴展性能,且保持傳統數據庫支持的ACID特性。典型代表:SAP HANA,VoltDB,nuoDB,MariaDB,Pivotal

4、MPP(Massively Parallel Processing)數據庫:指使用多個SQL數據庫節點搭建的數據倉庫系統,MPP解決了單個SQL數據庫不能存放海量數據的問題。代表產品有Teradata,Vertica,Redshift,Greenplum

原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/230113.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
投稿專員的頭像投稿專員
上一篇 2024-12-10 13:18
下一篇 2024-12-10 13:18

相關推薦

發表回復

登錄後才能評論