一、數據庫是信息系統的核心
獲取與分析信息,是人類推動社會進步的關鍵過程。如何持續提 高信息處理的能力,是人類社會的持續性命題。在計算機發明之後, 信息可經過其電子化編碼後轉化為數據。人類開始探索利用計算機算力優勢,實現對數據的高效存儲與計算,從而大幅提升信息處理效率。 人類首先嘗試開發出各類特定計算機應用程序完成相關工作,但由於各類特定應用程序復用性差,人類逐漸圍繞數據存儲和計算功能、抽象出滿足組織信息化需求、邏輯關聯的數據庫。
數據庫是支持一個或多個應用領域,按概念結構組織的數據集合, 其概念結構描述這些數據的特徵及其對應實體間的聯繫。數據庫中的數據按一定的數據模型組織、描述和存儲,具有較小冗餘度、較高 數據獨立性和易擴展性,並可為各種用戶共享。數據庫由於綜合成本低、處理能力高,扮演各類信息系統的核心角色。
六十餘年發展過程中,數據庫共經歷前關係型、關係型和後關係型三大階段。前關係型階段數據庫的數據模型主要基於網狀模型和層次模型,在當時較好地解決了數據集中存儲和共享的問題,但在數據抽象程度和獨立性上存在明顯不足。關係型階段提出關係模型概念,論述範式理論作為開啟標誌,期間誕生了一批廣泛應用的關係型數據庫,該階段技術脈絡逐步清晰、市場格局趨於穩定。後關係型數據庫階段由於數據規模爆炸增長、數據類型不斷豐富、數據應用 不斷深化,技術路線呈現多樣化發展。隨着各行業數字化轉型不斷深 入,5G、雲計算等新興技術快速發展,傳統數據庫的應用系統紛紛優化升級。全球市場格局劇烈變革,我國數據庫產業進入重大發展機遇期。
二、數據庫關鍵技術及發展趨勢
數據庫管理系統作為能夠使用戶定義、創建、維護和控制訪問數 據庫的軟件系統,其整體架構與技術路線不斷深化發展,如今呈現集中式與分佈式並存,數據模型不斷拓展等技術現狀。
(一)數據庫管理系統典型架構
數據庫管理系統由於不同產品實現細節不完全相同,此處僅對部分主流數據庫產品做進一步抽象處理得出上述架構。數據庫大致可以 由內核組件集與外部組件集共同組成,其中外部組件集以數據庫配套 的獨立支撐軟件為主。

存儲組件是負責數據持久化存儲的組件,對數據庫的日誌、索引、 堆數據等內容進行管理。在新一代的存算分離體系下,數據庫堆數據 的存儲可能是由外部的分佈式存儲系統承擔;計算組件又可以稱為協調組件、服務組件,負責響應數據庫訪問請求,並將 SQL 語言解析成為數據庫對應的內部任務。計算組件在分佈式、集群等架構下也承 接大部分的計算任務;管理組件用於對數據庫全生命狀態的管理,以及各類中心化任務承接;網 絡組件管理整個數據庫管理系統的網絡通訊的組件。數據庫的網絡通訊有內部和外部之分。內部一般指在集群環境或者分佈式環境下的各節點之間的高速數據交換。外部一般指的是各個數據庫通過對外訪問協議與存在於客戶端的驅動進行互聯的網絡交換;驅動組件是支撐數據庫能正常提供服務的配套獨立組件,數據庫管理系統基於其通用特性,往往可以對不同語言開發的軟件提供數據服務。但是由於數據庫本身只對外提供網絡通訊協議,對協議的封裝則由客戶端側的不同驅動組件完成。
(二)數據庫技術發展歷程
從 20 世紀 60 年代至今,數據庫的發展歷程大致分為以下三個階段:
1.前關係型階段(1960-1970):網狀層次數據庫初嘗探索
1963 年開發出世界上第一個數據庫管理系統也是第一個網狀DBMS集成數據存儲。網狀 DBMS 的誕生對當時的信息系統產生了廣泛而深遠的影響,解決了層次結構無法建模更 複雜的數據關係的建模問題。
同時期為解決「阿波羅登月」計劃處理龐大數據量的需求,北美航空公司開發出 GUAM軟件。其設計思想是將多個小組件構成較大組件,最終組成完整產品。 這是一種倒置樹的結構,也被稱之為層次結構。隨後 IBM 加入 NAA, 將 GUAM 發展成為 IMS系統成為最早商品化的層次 DBMS。
2.關係型階段(1970-2008):關係型數據庫大規模應用
第一階段的 DBMS 解決了數據的獨立存儲、統一管理和統一訪 問的問題,實現了數據和程序的分離,但缺少被廣泛接受的理論基礎, 同時也不方便使用,即便是對記錄進行簡單訪問,依然需要編寫複雜 程序,所以數據庫仍需完善理論從而規模化應用落地。第二階段開啟的標誌是一 篇論文提出基於集合論和謂詞邏輯的關係模型,為關係型數據庫技術奠定了理論基礎。這篇論文彌補了之前方法的不足,促使 IBM 的 San José實驗室啟動驗證關係型數據庫管理系統的原型項目 System R,數據庫發展正式進入第二階段。1974 年,Ingres 原型誕生,為後續大量基於其源碼開發的 PostgreSQL、Sybase、Informix 和 Tandem 等著名產品打下堅實基礎。 1977 年,Oracle 前身 SDL 成立。1978 年,SDL 發佈 Oracle 第一個版本。
20 世紀 80 年代,關係型數據庫進入商業化時代。1983 年,IBM 發佈 Database2 (DB2) for MVS,標誌 DB2 正式誕生。1985 年,Informix 發佈第一 款產品。1986 年,美國國家標準局(ANSI)數據庫委員會批准 SQL 作 為數據庫語言的美國標準並公布標準 SQL 文本。1987 年,國際標準 化組織(ISO)也做出了同樣決定,對 SQL 進行標準化規範並不斷更新, 使得 SQL 成為關係型數據庫的主流語言。此後相當長的一段時間內, 不論是微機、小型機還是大型機,不論是哪種數據庫系統,都採用 SQL 作為數據存取語言,各個公司紛紛推出各自支持 SQL 的軟件或 接口。同年 5 月,Sybase 發佈首款產品。
20 世紀 90 年代,Access、PostgreSQL 和 MySQL 相繼發佈。至此,關係型數據庫理論得到了充分的完善、擴展和應用,在後關係型 階段,關係型數據庫仍在發展演進,從未中止。
3.後關係型階段(2008-至今):模型拓展與架構解耦並存
進入 21 世紀,隨着信息技術及互聯網不斷進步,數據量呈現爆髮式增長,各行業領域對數據庫技術提出了更多需求,數據模型不斷 豐富、技術架構逐漸解耦,一部分數據庫走向分佈式、多模處理、存算分離的方向演進。谷歌在 2003 至 2004 年公布了關於三篇技術論文為分佈式數據庫奠定基礎, Mike Stonebraker 提出「one size does not fit all」並依照此理念推出多種數據模型、存儲介質的數據庫,數據庫發展正式進入第三階段。
數據模型不斷拓展。步入互聯網 Web 2.0 和移動互聯網時代,許 多互聯網應用表現出高並發讀寫、海量數據處理、數據結構不統一等 特點,關係型數據庫並不能很好地支持這些場景。另一方面,非關係型數據庫有着高並發讀寫、數據高可用性、海量數據存儲和實時分析 等特點,能較好地支持這些應用的需求。因此,一些非關係型數據庫也開始興起。為了解決大規模數據集合和多種數據類型帶來的挑戰, NoSQL 數據庫應運而生,其訪問速度快,適宜處理互聯網時代容量大、多樣性高、流動性強的數據。

分佈式架構逐漸成熟。由於傳統基於集中式數據庫在應對海量數據及複雜分析處理時,存在數據庫的橫向擴展能力受限、數據存儲和計算能力受限、不能滿足業務瞬時高峰的性能等根本性的架構問題。 利用分佈式計算和內存計算等新技術設計的分佈式數據庫能夠解決上述遇到的性能不足等問題。分佈式數據庫的數據分散在網絡上多個互聯的節點上,數據量、寫入讀取的負載均衡分散到多個單機中,集群中某個節點故障整個集群仍然能繼續工作,數據通過分片、複製、 分區等方式實現分佈存儲。每個數據節點的數據會存在一個或者多個副本,提供數據冗餘。當某個數據節點出現故障時,可以從其副本節點獲取數據,避免數據的丟失,進而提升了整個分佈式集群的可靠性。 為保障分佈式事務在跨節點處理時事務的原子性和一致性,一般使用分佈式協議處理。;使用 Paxos、Raft 等協議同步數據庫的事務日誌從而保障事務的 一致性。分佈式數據庫技術架構大致可分為如下三類:
以 Apache Cassandra 、Apache HBase 為代表的分佈式存儲為基 礎的數據庫,底層存儲基於分佈式文件系統具備了分片或者分區存儲 的能力,擴大了普通存儲設備的存儲系統的上限。
以 Greenplum 為代表的 Shared-Nothing 架構,通過多節點協同工 作擴大分佈式存儲能力的同時,相應的還通過 MPP 架構可以支持多 級並行計算處理,增強查詢和分析能力。
以 Kylin 為代表的多維數據庫產品,以及以 OpenTSDB 為代表的 時序數據庫,使用其它分佈式數據庫作為後台存儲,通過構建相應的 數據模型和索引技術,擴展成為新的數據庫。
其他還包括分庫分表等中間件解決方案,嚴格來說不屬數據庫系 統,但是提供類分佈式數據庫解決方案,適用於合適的業務場景對分 布式數據庫的需求。
(三)數據庫技術發展趨勢
大數據時代,數據量不斷爆炸式增長,數據存儲結構也越來越靈 活多樣,日益變革的新興業務需求催生數據庫及應用系統的存在形式 愈發豐富,這些變化均對數據庫的各類能力不斷提出挑戰,推動數據庫技術的不斷演進,總結起來體現為三個方向:1)多模數據庫實現 一庫多用、利用統一框架支撐混合負載處理、運用 AI 實現管理自治, 提升易用性、降低使用成本;2)充分利用新 興硬件、與雲基礎設施深度結合,增強功能、提升性能;3)利用隱私計算技術助力安全能力提升、區塊鏈數據庫輔助數 據存證溯源,提升數據可信與安全。
1.趨勢一:多模數據庫實現一庫多用
後關係型階段,數據結構越來越靈活多樣。面對這些多種結構的數據,應用程序對不同數據提出了不同存儲要求, 數據的多樣性成為數據庫平檯面臨的一大挑戰,數據庫因此需要適應多類型數據管理的需求。多模數據庫支持靈活的數據存儲類型,將各種類型的數據進行集中存儲、查詢和處理,可以同時滿足應用程序對於結構化、半結構化和非結構化數據的統一管理需求。未來在雲化架構下,多類型數據管理是一種新趨勢, 也是簡化運維、節省開發成本的一個新選擇。
2.趨勢二:統一框架支撐分析與事務混合處理
業務系統的數據處理分為聯機事務處理與聯機分析處理兩類。企業通常維護不同數據庫以便支持兩類不同的任務,管理和維護成本高。因此,能夠統一支持 OLTP 和 OLAP 的數據庫成為眾多企業的需求。產業界當先正基於創新的計算存儲框架研發HTAP 數據庫,其能夠基於統一套引擎同時支撐業務系統運行和分析決策場景,避免在傳統架構中,在線與離線數據庫之間大量的數據交互。
3.趨勢三:運用 AI 實現管理自治
面對大規模數據和不同的應用場景,傳統數據庫組件存在業務類型不敏感、查詢優化能力弱等問題。目前有研究通過將傳統數據庫組 件用機器學習算法替代,來實現更高的查詢和存儲效率,自動化處理各種任務。機器學習算法可以分析大量數據記錄,標記異常值和異常模式,幫助企業提高安全性,防範入侵者破壞,還可以在系統運行時自動、連續、無人工干預地執行修補、調優、備份和 升級操作,儘可能減少人為錯誤或惡意行為,確保數據庫高效運行、 安全無失。
4.趨勢四:充分利用新興硬件
最近十幾年,新興硬件在經歷學術研究、工程化和產品化階段發展,對數據庫系統設計提供了廣闊思路。期間最主要的硬件技術進步是多處理器、多核、大內存和 固態硬盤,多處理器和多核為並行處理提供可能,SSD 大幅提升了數據庫系統的 IOPS 和降低延遲,大內存促進了內存數據庫引 擎的發展; GPU 適用於特定數據庫操作加速,如掃描、謂詞過濾、大量數據的 排序、大表關聯、聚集等操作。隨着新型硬件成本逐漸降低,充分利用新興硬件資源提升數據 庫性能、降低成本,是未來數據庫發展的重要方向之一。
5.趨勢五:與雲基礎設施深度結合
雲計算技術 的不斷發展催生出將數據庫部署在雲上的需求,通過雲服務形式提供數據庫功能的雲數據庫應運而生。雲與數據庫的融合,減少了數據庫參數的重複配置,具有快速部署、高擴展性、高可用性、可遷移性、 易運維性和資源隔離等特點,具體有兩種形態,一種是基於雲資源部署的傳統數據庫;另一種是基於容器化、微服務、Serverless 等理念 設計的存算分離架構的雲原生數據庫。雲原生數據庫能夠隨時隨地從 多前端訪問,提供雲服務的計算節點,並且能夠靈活及時調動資源進行擴縮容,助力企業降本增效。未來,數據庫將深度結合雲原生與分佈式特點,幫助用戶實現最大限度資源池化、彈性變配、 超高並發等能力,更加便捷、低成本實現雲上數字化轉型與升級。
6.趨勢六:隱私計算技術助力安全能力提升
隨着數據上雲趨勢顯著,雲數據庫面臨的風險相較於傳統數據庫更加多樣化、複雜化。如何解決第三方可信問題是雲數據庫面臨的首要安全挑戰。當前雲數據庫數據安全隱私保護是針對數據所處階段來制定保護措施的。這些傳統技術手段可以解決單點風險,但不成體系,且對處於運行或者運維狀態下的數據則缺少有效的保護。近年來以同態加 密等密碼學為代表的軟件解決方案和以可信執行環境為代表 的硬件方案為數據庫安全設計提供許多新思路。密碼學方案的核心思路是整個運算過程都是在密文狀態,通過基於數學理論的算法來直接對密文數據進行檢索與計算。硬件方案的核心思路是將存放於普通環 境的加密數據傳遞給 TEE 側,並在 TEE 側完成數據解密和計算任務。未來,此類數據庫將圍繞算法安全性和性能損耗等問題,逐步突破,進而提供覆蓋數據全生命周期的安全保護機制。
7.趨勢七:區塊鏈數據庫輔助數據存證溯源
數據庫管理員或黑客對數據庫歷史記錄的修改是一個經常爆發的問題。區塊鏈具有去中心化、信息不可篡改等特徵,數據庫能夠長期留存有效記錄,所有歷史操作均不可更改並能追溯, 適用於金融機構、公安等行業的應用場景。區塊鏈數據庫由於要容忍節點拜占庭行為而不得不採用代價更高的共識算法成為落地應用的一大挑戰。由於沒有統一的協調者,如何保證區塊鏈網絡分片時分佈式系統的安全性,高並發下的並行控制如何保證 ACID 也都是設計者不可忽視的問題。未來,提升區塊鏈數據庫性能將成為學術界與工業界共同探索的命題。
三、數據庫產業發展
全球數據庫產業生態成熟壯大,在發展過程中,逐漸細分出數據 庫產品、數據庫服務和數據庫支撐體系三個細分產業。
(一)數據庫產業概述

數據庫產品主要由關係型數據庫、非關係型數據庫、混合型數據庫及數據庫周邊工具構成。數據庫服務是指圍繞數據庫的諮詢規劃、 實施部署和運維運營等環節,為數據庫系統的正常、高效、持續、安全使用提供信息技術服務工作。數據庫支撐體系由從事數據庫學術研究、人才培養、開源社區、評測認證等工作的相關主體共同構成。
(二)數據庫產品
1.企業主體大部分仍處於發展初期階段
成立時間呈現兩個熱周期。國內由於頂層設計加碼,掀起一股國產數據庫的浪潮。2012 年, 大數據成為國家級發展戰略。政策利好與資本關注 為我國數據庫產業不斷注入新活力,國產數據庫產業迎來第二輪浪潮。
地域分佈以一線城市為主。總部分佈情況代表企業所在城市對數據庫產業的重視與發展程度;員工數量普遍在百人以下。我國數據庫雖然數量眾多,但平均從業人員數量較少,仍在快速發展階段;平均專利數量不足五十個余,仍有較大發展空間。
2.產品類型仍以關係型為主,非關係型產品正在快速發展
我國數據庫產品數量分佈呈現以關係型為主,非關係型及混合型 數據庫為輔的局面。數據庫產品根據研發方式不同,分為完全自研和基於開源二次研發兩類。
我國關係型數據庫產品多數基於 MySQL 和 PostgreSQL 二次開 發而來;我國非關係型數據庫產品發展勢頭良好,逐漸受到國際認可。非關係型數據庫中以基於開源數據庫品進行二次開發為主,時序數據庫因其存儲處理海量時序數據的特性,常應用於工業控制、物聯網、車聯網等領域。
3.市場份額正逐漸傾向雲上,線下市場迎來激烈競爭
線上市場呈現快速增長。隨着雲計算技術不斷成熟,雲上數據庫市場快速增長;線上市場格局巨頭湧現。我國頭部雲服務商處於領先地位, 雲上數據庫作為雲基礎設施的延續與發展,具備天然先發優勢;存量市場替換空間可觀,線下市場迎來激烈競爭。隨着市場傾向的變化,傳統部署市場替換國外數據庫空間巨大。隨着技術層面的分佈 式改造需求不斷以及市場層面自發選擇國產產品傾向,國產數據庫市場份額有望得到大幅提升,各企業紛紛搶抓戰略機遇,不斷迭代打磨產品能力,搶佔市場份額。國產數據庫供給能力得到大幅提升,產品功能逐漸完善,集群規模與日俱增,性能表現不斷攀升,市場競爭程度較為激烈;初創企業和巨頭陸續投身開源市場。開源已成為數據庫產業的共識,開源有助於擴 大人才規模及上下游生態影響力,通過運營開源社區快速獲得反饋並加快產品開發、提升產品質量,同時反哺社區開發者及獨立軟件開發商等生態夥伴,能夠達到多方共贏目的。
(三)數據庫服務
很長一段時間內,我國數據庫服務工作主要以附屬技能的形式由應用開發商和硬件服務商提供保障。隨着數據庫對於企業的重要性越來越高,企業對於以數據庫為核心的專業服務的需求也越加迫切,獨立的數據庫服務廠商開始嶄露頭角,並形成了一個專業化的數據庫細分服務領域。
1.頭部企業主體發展時間較長
數據庫服務產業主體主要由多年來在電信、金融、政務等重要行業提供外包 IT 運維服務的企業構成,成立時間普遍十年以上,核心成員多為早期提供服務的專家,由於企業數據庫技術體系龐雜,需要服務提供商能夠提供橫向主流數據庫產品 和縱向多版本技術服務覆蓋能力,服務行業技術壁壘較高。
2.服務工作範圍廣,缺乏行業規範和指引
數據驅動時代,企業開始利用海量實時數據分析業務發展、了解客戶行為和優化配置資源,並據此制定企業發展戰略。數據庫系統作為數據存儲的主要載體,數據庫服務貫穿企業 IT 系統的整個生命周期。按照信息系統建設的不同階段,數據庫的服務範圍主要覆蓋規劃 設計、實施部署、運維運營三個方面。

由於數據庫服務產業正處於快速變革期,玩家眾多,能力水平參差不齊,服務過程缺乏行業規範和指引,導致眾多數據庫應用單位面臨各類選型和實施問題。通過編製發佈團體標準期望為國內的數據庫服務生態體系提出更全面和專業的評估標準。
3.服務市場集中在重點行業,環境變革倒逼各主體轉型升級
服務市場主要集中在金融、電信、政府、製造、交通五個行業。雲計算改變傳統服務市場格局。在雲計算逐漸成熟之後,與雲上 數據庫市場份額迅速擴大。而雲上數據庫的諮詢、部署、運維等服務 工作則直接由雲計算公司負責,所以雲計算公司將改變傳統服務市場 格局。由於服務工作定製化程度較高,相對標準化雲產品,屬於勞動力密集型工作,所以從綜合成本角度出發,未來雲上數據庫服務市場 部分將由雲計算公司依靠自身資源儲備負責,另一部分雲計算公司將與線下服務公司進行合作,形成優勢互補,共同完成相關工作。
服務企業向產品企業轉型。如今隨着分佈式雲數據庫興起,數據庫運維要求不斷提升,數據庫服務商除了提供傳統的駐場與遠程運維類服務外,圍繞數據庫開發、測試、運維等環節也提供多種類型的數據庫周邊工具。為了拓展業務範圍,提升企業利潤總額, 認識到可以利用自身服務能力積累與經驗,對數據庫產品供應商形成 差異化優勢,順勢推出自有數據庫產品,進一步加劇了數據庫產品市 場競爭激烈程度。
(四)數據庫支撐體系
當前數據庫支撐體系由於數據庫技術路線不斷演進,也正處於變革和創新的高發期。
1.學術研究仍以關係理論為重點,國內研究水平逐漸提升
學術界公認的數據庫領域頂級會議主要有 VLDB、SIGMOD 和 ICDE。從這些會議的研究方向看,當前以關係型數據庫為主,非關係型數據庫為輔。綜合分析全球論文研究主題,除了關係型數據庫,圖論、圖數據 庫、查詢優化、機器學習、分佈式處理、時序數據、流數據、時空數 據、雲數據庫等代表當前火熱的技術方向。此外,數據安全、隱私保 護也是每年不可或缺的研究主題;我國在全球數據庫領域學術影響逐漸提升。
2.領域內各類組織形成,產業熱度不斷提高
數據庫支撐體系各類組織主要分為以下四類:一類是由具備官方背景的研究組織,用於 匯聚國內數據庫理論研究頭部力量;第二類是數據庫從業人員牽頭髮 起的面向數據庫技術愛好者的用戶組織,用於進行各類專題技術交流和討論;第三類是由數據庫企業組建,針對自身特定產品討論的官方技術社區,;第四類是匯聚數據庫整體行業信息的第三方技術社區,用於搭建領域內線上交流平台。
3.多層級數據庫人才培訓體系正在快速形成
高校教育注重普適教育,重視社會人才發展大趨勢需求。通過原 理性知識傳授、數據庫系統應用實踐等教學方式,為數據庫產業發展 提供了大量儲備人才。
培訓機構是數據庫人才認證獲取的主要途徑。培訓機構累計為合作夥伴培訓學員超 5 萬人次,其中獲得 Oracle、MySQL、PostgreSQL 認證學員數千人,為企業輸送專業 DBA 萬餘人。培訓方式為廠商授 權培訓中心或聯合認證培訓中心等,培訓知識主要面向數據庫工程實踐和應用。
企業培訓基於人才培養時間成本、人才可用性等考量因素,多渠道聚集人才。一方面,數據庫廠商開始建立自己的認證體系,並形成 了不同級別的培訓課程和認證考試;另一方面,一些企業開始加強與院校的產教融合嘗試,通過與高校進行教材編撰、實訓開發、專業共建、人才共建等合作項目,在高校提前培養數據庫相關儲備人才。
4.數據庫領域受資本市場高度追捧
近些年隨着國產數據庫概念的火熱與應用需求多樣化帶動的技術變革,國內外各路資本紛紛注入數據庫產業,形成「百舸爭流」的旺盛態勢。
四、數據庫典型行業應用動態
通過 IT 監管環境、數據業務複雜性、核心業務數據類型、 成本敏感性、科技能力儲備情況五個維度對五個典型行業進行分析:

通過分析,金融行業和電信行業在五個維度方面表現相同,所以其數據庫應用現狀和未來發展趨勢類似。
(一)金融行業&電信行業
傳統金融機構(銀行、證券、保險)和電信運營商作為支撐國民經濟正常運行的關鍵行業,兩 個行業的重要數據庫系統由於支撐大量涉賬業務,業務正確性和連續 性關係國計民生,在強監管壓力下,對數據一致性要求極高,所以主要應用以關係型數據庫為主。
目前金融和電信行業在數據庫應用方面呈現五個新需求:一是隨着移動互聯網的發展,數據量呈現急劇增長,這對數據存儲和管理提出了更高要求;二是隨着普惠金融落地,其對業務連續性能力更加重視;三是隨着電子支付的大面積普及,需要面臨高並發業務和高用戶量帶來的系統壓力;四是面臨互聯網金融對傳統金融業務的衝擊以及提速降費要求,業務創新要求進 一步強烈;五是防止潛在供應鏈風險,技術層面存在國產化需求。根 據上述需求分析,金融和電信行業在數據庫應用方面正在呈現三大趨 勢:
一是大部分存量數據庫將向分佈式架構升級。金融和電信行業核 心業務數據類型均為關係型數據庫,在當前信息科技背景下,此類集中式數據庫所面臨的業務體量將呈現爆發性增長。同時由於單一硬件 能力增長有限,所以無法依靠縱向升級硬件擴展存量數據庫能力上限。 而與集中式事務數據庫相比,分佈式數據庫採用多種模式實現數據的 分散存儲,將壓力分散到不同服務器上,並不斷通過增加存儲或計算 節點來實現彈性升級,克服了集中式數據庫的諸多缺點。
二是應用大量非關係型數據庫助力創新業務落地。金融機構和電 信運營商擁有龐大客戶群體的各類數據,覆蓋客戶、賬戶、產品、交易等大量的結構化數據,以及海量的語音、圖像、視頻等非結構化數據。這些數據背後蘊藏的豐富全面的信息資源,能夠有效賦能其自身業務發展。而這些數據的價值挖掘,均需應用到圖數據庫、文檔數據庫等非關係型數據庫,所以 未來將會有大量非關係型數據庫助力金融和電信創新業務落地,
三是產品選型逐漸傾向國產數據庫供應商。金融和電信行業數據庫產品類型以國外商用產品和國外社區開源產品為主, 但當前受國際單邊保護主義影響,國外商用數據庫產品存在潛在供應鏈風險。面對強監管的要求,金融和電信行業對於風險的容忍度極低, 所以各機構在選型方面均開始傾向國產數據庫。國產數據庫產品功能、性能水平不斷增強,產業供給能力整體進入上升周期,增強了金融和電信機構選型國產數據庫產品信心。
(二)政務行業
數字政府能力的提升,需依賴強大的現代 化的智能治理基礎設施,而數據庫作為支撐數據存儲和計算的核心組件,是智能治理基礎設施的重要組成部分。
當前我國在提升社會治理的數字化治理水平過程中,主要呈現兩大特點:一是個體、企業和社會等被治理對象數量龐大、日趨複雜, 而當前我國智能治理基礎設施仍以傳統關係型數據庫為主,效率較低, 亟需變革更新;二是智能治理要求各層、各機構政府人員深度應用信 息科技工具,而當前信息科技工具應用普遍需要較高門檻,政務行業 科技能力儲備情況較普遍較低,導致數據基礎設施建設完成之後,應 用效果不佳,難以達到預期效果。
當前政務行業在數據庫應用方面正在呈現兩大趨勢:
一是大範圍應用空間型、關聯型數據庫等產品。社會治理普遍基於空間位置和人、物、企業等實體的關聯關係進行,而傳統關係型數據庫在面對空間位置和實體關聯關係的分析和建模能力不足。當前空間型數據庫和圖數據庫的快速發展提高了空間位置數據和實體關聯 關係分析的存儲和分析效率,將是未來智能治理中數據庫的重要應用方向。
二是利用各類工具組件,做到數據庫應用「平民化」。為達到政務 人員深度應用信息科技工具目的,一方面在加強政務人員信息化能力 同時,數據庫應用過程也需盡量做到「平民化」,包括但不限於具備 可視化建模能力、支持特定政務領域解決方案模板、流程式指引等。
(三)製造業
隨着政策環境的鋪墊和工業互聯網基礎設施的逐步完善,工業大數據迎來重大發展機遇。當前物聯網技術正逐步滲透工業領域,不斷增長的傳感器、飆升的數據量以及更高的大數據分析需求對原有的數據庫系統提出了新的需求,包括增加擴展性、實現與大數據技術生態的友好對接、降低大規模應用價格、充分利用邊緣計算設備能力。
未來工業行業在數據庫應用方面將呈現兩大趨勢:
一是應用大量時序數據庫。隨着物聯網場景的豐富以及人們對信息全面掌控的需求,基於時間序列數據類型的應用越來越多,工業業 務對於查詢的要求已經不僅僅是滿足於一些基礎的條件查詢或是插 值查詢,查詢會大量擴展到基於時間的維度,而時序數據庫更契合此類場景。
二是逐步向邊緣計算髮展。工業領域是 IoT 的重要試驗田。當數 據過於龐大,集中化的處理方式就很難響應實時的數據分析需求,這 就帶來了數據計算向邊緣的發展,需要實時響應的監控就通過邊緣設 備及時的處理並反饋,需要用於大規模分析的數據再進行集中存儲, 這種分級的處理方式能夠有效地提升時效性數據的價值,同時減輕存 儲系統的負擔,當前許多工業數據庫正在研發邊緣計算版本。
(四)互聯網
當前我國互聯網行業發展進入調整期,上市企業營收政府大幅放緩,總市值持續波動,投融資低位徘徊,行業格局出現分化。互聯網 行業為充分發揮新要素、新模式、新動能等方面的優勢,對底層 IT系統中的數據庫提出了多項新要求,以性能好、造價低、迭代快為核心。
未來互聯網行業在數據庫應用方面將呈現三大趨勢:
一是利用內存數據庫加速業務效率。隨着動態隨機存儲器容量的上升和單位價格的下降,使大量數據在內存中的 存儲和處理成為可能,Redis、Memcached 等內存數據庫逐漸成熟, 應用範圍越來越廣。未來幾年,隨着非易失性存儲器件(NVM)逐 步投入商用,新硬件將會給內存數據庫帶來更大的發展機遇。
二是開源數據庫應用更加廣泛。開源數據庫具有獲取方便、成本低等優勢,同時互聯網企業科技能力強、對於成本敏感等特點,所以 開源數據庫產品在互聯網行業已被廣泛應用。當前越來越多的數據庫 企業將開源作為一種商業運營策略,所以開源數據庫市場將更加豐富, 為其進一步在互聯網領域廣泛應用提供了條件。
三是初創公司利用雲數據庫促進其快速發展。互聯網創業公司一 般具備人數較少、資金有限、場地不足等特點,無法投入大量資源用 於建設 IT 基礎設施。當前各大雲計算公司推出眾多雲數據庫產品,由於利用了雲資源的優勢,雲數據庫具備彈性好、計費模式便捷、套 件生態好等特點,符合互聯網創業公司的應用需求。互聯網創業公司 未來將更大面積應用雲數據庫。
五、總結與展望
數據庫作為提供數據存儲與處理能力的軟件產品,是各機構信息系統的關鍵部件,是助力數據價值釋放的核心引擎。隨着數據躍升為生產要素,數據重要性進一步提高,我國數據庫產業也迎來新一輪變局。

從產業角度看,宏觀政策利好推動了存量數據庫市場上行,我國數據庫產業進入蓬勃發展的初期,產品供應商、服務提供商、支撐產 業從業者均積極行動,各自發揮技術、渠道、運營等優勢,尋求對於 自身最優的發展路徑;另一方面雲基礎設施的發展成熟將接近一半的傳統數據庫市場轉移到了線上,雲計算企業利用既有基礎設施優勢, 成為最大獲益者。
從技術角度看,一方面數據應用的變化倒逼數據庫具備更大數據存儲容量、更多數據計算模型、更快數據業務響應能力,整體技術發展進入後關係型階段,架構設計逐漸分佈式化、模型構建逐漸場景化; 另一方面,人工智能、新型硬件、區塊鏈、密態計算等關聯技術的創 新正在催生新型數據庫設計模式,傳統數據庫功能邊界正被逐漸突破。
在數據庫產業和技術的變局過程中,供給側、應用側、生態側均 處於機遇與挑戰並存的狀態。未來一段時期,我國數據庫行業將圍繞 兩個核心命題進行發展:
一個是縮小「高要求的存量數據應用需求」與「仍處於發展初期 階段的供給能力」之間的差距。在存量數據應用需求方面,國際數據庫產品已經為我國數據庫行業樹立了發展的目標與方向,相比之下, 我國數據庫產業供給能力仍處於發展初期,與應用方既有的使用預期仍存在差距。預計我國數據庫行業未來圍繞「技術」和「生態」兩條 主線,一方面利用資金、開源、人才、場景等資源完成技術成熟度達標,另一方面補足運營、服務、渠道短板,完成生態成熟度達標。
另一個是探索「創新型數據應用需求」與「數據庫技術產品演進 路線」的合理映射關係。創新型數據應用需求是更長周期內數據庫產 業發展的牽引力,但是數據庫技術產品如何演進、從而滿足創新型數據應用需求並不存在成熟的路線圖,所以未來數據庫技術產品將在一 段時間內呈現較強的隨機演進狀態。為解決這一核心命題,數據應用 方與數據庫供給方必須利用產業平台、人才互通等手段,完成深度融合與綁定。
「明者見於無形,智者慮於未萌。」當前我國數據庫產業的發展格局,是緊跟時代步伐順應歷史規律、着眼全球提升國際綜合競爭力、 立足國情推動新舊動能接續轉換的外在表現。我們相信,以數據庫為代表的新型數據基礎設施不斷創新發展,對於全面建設社會主義現代 化國家的征程,將起到重要的推動作用。未來已來,拭目以待。
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/225765.html
微信掃一掃
支付寶掃一掃