國產開源數據庫盤點與思考
原創近期,一款國產數據庫開源的消息引起我的關注。針對數據庫的開源,好像已經是很久遠的事情。曾幾何時,數據庫開源是個很“時髦”的事,也吸引了大量技術人員的關注。那么如今,這些開源數據庫又發展的如何呢?國產數據庫的開源生態又怎樣呢?筆者對主流的國產開源數據庫做了個整理,從中一窺當前的國內開源現狀。
1. 開源必須回答的幾個問題
在談國產開源數據庫之前,我們先嘗試回答幾個問題。這些問題也是開源圈大家經常關注的問題。也許有些觀點比較刺耳,但還是有必要講一講的。
1)開源的目的是什么
對于數據庫這類基礎軟件而言,開源的目的更是多元而復雜,交織著技術理想、商業考量和市場現實。深入剖析,其主要動機可歸納為以下幾類:
目的之一,生態構建與破局
數據庫的成功,產品力只是基礎,其成敗還取決于周邊生態的繁榮程度——包括可視化工具、數據同步服務、ORM框架、以及豐富的應用案例。國產數據庫起步較晚,在面對Oracle、MySQL、PostgreSQL等國際巨頭早已構筑的龐大生態壁壘時,單打獨斗難有勝算。通過將全部或核心代碼開源,能極大地降低開發者的學習和試用成本,吸引一批早期的采納者、貢獻者和合作伙伴。他們基于該數據庫構建工具、開發應用、貢獻代碼,從而像滾雪球一樣,快速形成一個圍繞該數據庫的技術共同體。例如華為開源openGauss,正是希望借助社區力量,打破生態的壟斷,打造一個根植于中國的數據庫生態體系。這是目前國產數據庫開源最核心、也最現實的目標。
目的之二,產品與市場匹配(PMF)
這一目的在工具型產品中尤為顯著,通過開源,項目可以直接暴露在最真實、最苛刻的生產環境中,接受海量用戶和各類極端場景的檢驗。社區用戶提交的Issue和Pull Request成為了最寶貴、最直接的產品反饋,驅動著產品快速迭代和架構優化。這種“在實戰中打磨”的方式,遠勝于閉門造車。然而,在純粹的toB(企業級)商業模式下,這一點的有效性會打折扣。企業級客戶更看重的是穩定性、安全性和官方支持,他們通常不愿在核心業務上貿然采用一個由社區驅動的、尚未經過充分驗證的版本。因此,對于定位高端企業市場的數據庫,開源版本更多是充當一個功能可能稍遜但足夠可靠的“體驗版”,其PMF的驗證更多地依賴于與頭部客戶的深度共創,而非廣泛的社區反饋。
目的之三,為商業轉化鋪路
經典的“開源商業模式”如Open Core(開放核心:基礎版開源,高級特性付費)或提供云托管服務,在國際上有Confluent、MongoDB等成功先例。其邏輯是通過開源版本構建龐大的用戶池,再從中轉化有高階需求的企業客戶。然而,在中國市場,這一路徑至今未有被廣泛認可的成功案例。原因在于,國內客戶為軟件付費的意愿本就相對薄弱,尤其難以接受為“高級功能”或“技術支持”支付高昂費用。更嚴峻的是,云廠商的“搭便車”行為——即直接將開源軟件打包成商業化云服務,卻無需回饋核心項目——極大地擠壓了原廠的盈利空間。因此,希望通過開源直接實現大規模商業變現,在當前環境下更像一個美好的愿景而非可靠的戰略。
目的之四,成為融資的“敲門磚”
在資本市場追捧“硬科技”和“國產替代”概念的風口期,一個高Star數、高活躍度的開源項目,是技術實力和品牌聲量的最佳證明,能顯著提升公司在投資機構眼中的估值。然而,隨著資本市場的理性回歸,投資邏輯已從“看故事”轉向“看營收”。如今,若一個開源項目無法展現出清晰的商業化路徑和真實的收入能力,僅憑開源熱度已難以獲得資本的持續青睞。
目的之五,情懷與戰略投入
少部分大型科技公司開源其內部久經考驗的數據庫(如阿里開源AliSQL),既有反哺社區、推動行業技術進步的理想主義色彩,也是一種提升公司技術品牌形象、吸引頂尖人才的戰略舉措。這種“情懷”背后,是強大的財力支撐和長遠的生態布局,而非中小創業公司可輕易模仿。
從上述目的可見,數據庫的開源是一項充滿戰略智慧的舉措,企業需要明確開源的目的,在當前嚴峻的市場環境下,理性看待開源的目的,有助于企業制定更符合自身實際的、可持續的開源戰略。
2)開源與商業版本的差異
數據庫產品的開源與商業版本之間存在差異,這是一種普遍行業現象(參考文章 )。這種差異更多是商業策略的考慮。廠商需要可持續的營收來支撐龐大的研發團隊和長期的生態建設。常見的策略是采用“開源核心,商業增值”的模式。即將基礎、穩定、能滿足大多數開發者學習和輕量級應用需求的版本開源,以此降低使用門檻,快速獲取用戶關注和社區影響力,構建生態基石。而將那些企業級客戶在核心生產環境中迫切需要的關鍵能力,設置為商業版本的核心價值。這些能力通常包括:高階運維功能(如可視化監控、智能診斷、一鍵巡檢)、高級安全特性(如數據脫敏、列級權限控制、審計日志)、官方原廠技術支持(SLA服務保障、緊急漏洞修復)以及與商業化云平臺深度集成的托管服務。
正因如此,企業在技術選型時,必須清醒地認識到這些差異點。選擇開源版本,絕不能僅評估其基礎性能,更要深入調研商業版本所獨有的能力是否為自己未來業務所必需。例如,一個在測試中性能卓越的開源數據庫,可能缺乏生產環境必需的便捷備份恢復或高可用自動故障切換工具,這些“能用”和“好用”之間的差距,往往是項目能否在線上穩定運行的關鍵。忽視這一點,可能導致項目后期面臨巨大的運維風險或高昂的二次開發成本。
在市場上,確實存在開源商業的平衡挑戰:如果開源版本過于強大,功能過于完善,反而會削弱客戶購買商業版本的意愿,導致“開源悖論”。因此,廠商在決定“哪些能力放入開源,哪些能力保留給商業”時,無異于一場戰略賭博。這需要精準洞察目標客戶的核心痛點和付費意愿,確保開源版本有足夠的吸引力,同時商業版本又能提供不可替代的增量價值。然而,在國內市場,從開源版本向商業版本的導流邏輯顯得異常脆弱。一方面,國內用戶為軟件許可付費的意愿本就相對較低,更傾向于通過自身技術力量克服開源版本的局限性;另一方面,云廠商的“搭便車”行為進一步擠壓了原廠的商業化空間。這使得希望通過開源快速積累用戶,再自然轉化為付費客戶的路徑,在實踐中屢屢受挫。
3)開源商業化的路徑成立
數據庫從開源到商業化的路徑,是一個在全球范圍內被廣泛探討且已被驗證可行的模式,但在中國特定的市場環境下,這條路徑的暢通性則需打上一個大大的問號。正如文章所談到的主流商業模式:提供增值服務(如RedHat)、采用雙版本策略(Open Core,如Elastic)以及提供云托管服務(Hosting,如MongoDB),都證明了開源軟件具備強大的商業潛力。其背后的經濟學原理在于,將核心代碼這一邊際成本近乎為零的部分免費開源,以此快速占領市場、構建開發者生態,最終通過互補品(高級功能、技術支持、云服務)實現價值變現。
然而,將視線轉回國內,上述這些在國際上通行的路徑卻面臨著“水土不服”的嚴峻挑戰,迄今為止尚未誕生一個可與國際巨頭比肩的、通過純粹開源模式實現大規模商業化的數據庫公司。其根源在于中國獨特的市場環境:首先,企業客戶為軟件許可付費的意愿相對較低,尤其難以接受為“技術支持”或“高級功能”支付高昂費用,這使得“增值服務”和“雙版本”模式的溢價能力被削弱。其次,國內云計算巨頭往往將優秀的開源數據庫直接封裝為云服務進行低價銷售,這種“搭便車”行為嚴重侵蝕了原廠通過“云托管”模式盈利的空間,形成了“開源成果被公有云收割”的困境。
因此,國內的數據庫廠商必須回歸理性,重新審視開源的核心目的。如果仍將“直接商業轉化”作為開源的首要乃至唯一目標,在當前環境下很可能事與愿違。開源更現實的價值在于生態構建和產品打磨,即通過開放源代碼快速獲取開發者信任、積累真實場景的使用反饋、奠定市場影響力。在此基礎上,廠商需要探索更符合國情的商業化路徑,例如:將開源版本與深度的行業解決方案綁定,打造無法被簡單云化的“產品+服務”一體化交付模式;或是在開源協議上進行創新,在鼓勵社區參與和保護商業利益之間尋找新的平衡點。總而言之,開源絕非商業化的捷徑,而是一條需要長期主義、戰略耐心和本土化創新思維的漫漫長路。
4)開源項目能上生產嗎
1.PNG
將開源數據庫用于生產環境,絕非簡單的技術選型替換,而是一場需要徹底轉變思維模式的戰略決策。企業必須清醒地認識到,使用開源數據庫與采購商業數據庫存在著本質區別,這意味著一套完全不同的責任與能力體系。商業數據庫提供的是一站式的“交鑰匙”工程,其價值不僅在于軟件功能,更在于隱含的SLA服務保障、明確的責任邊界以及完善的高級特性(如可視化運維平臺、高級安全功能、智能診斷等)。而選擇開源版本,企業獲得的往往是一個強大的“引擎”,但如何打造一輛能安全、穩定行駛的“整車”,則需要自身或借助第三方力量來填補從安裝部署、監控告警、備份容災到性能優化的全部能力空白。這意味著企業技術團隊需要具備深厚的運維能力和源碼級的問題排查能力,或者需要付費購買可靠的第三方技術服務,否則將面臨巨大的運維風險。
在中國特定的環境下,使用開源有一挑戰尤為突出,就是如何解決“兜底、背責”的問題。商業數據庫廠商之所以收費高昂,一部分價值正是為其產品提供最終的責任擔保(背鍋)。當核心業務數據庫出現嚴重故障導致業務停擺時,企業有明確的法律和合同依據向廠商追責。然而,在使用開源數據庫時,這一“保險”機制幾乎缺失。開源社區遵循“按原樣提供”的原則,不承擔任何責任。雖然國內也涌現出一些提供開源數據庫技術服務的公司,但其品牌背書、資金實力和承擔損失的能力,與Oracle、微軟等國際巨頭相比往往不可同日而語。這使得許多對穩定性要求極高的企業,尤其是金融、電信等關鍵行業,在是否將開源數據庫置于核心生產環節時躊躇不前,因為無人“背責”的潛在風險過高。
此外從成本角度進行深入評估,我們會發現,使用開源數據庫很多時候并非一種“經濟”的選擇,其總擁有成本(TCO)可能遠超預期。這絕不僅僅是軟件許可費為零所呈現的表面節約。真正的成本蘊含在多個方面:首先是人力的高投入,需要組建一支既懂數據庫內核又精通運維的高水平團隊,這類人才的人力成本極其昂貴;其次是運維體系的構建成本,需要自行或外購搭建一整套運維管理平臺;再者是潛在的故障風險成本,由于缺乏原廠第一時間的技術支持,故障恢復時間可能更長,導致的業務損失巨大。因此,企業在決策前必須進行全面的成本效益分析,將所有這些隱性成本計算在內,才能做出符合自身長期利益的理性判斷。
綜上所述,開源數據庫上生產在技術上是完全可行的,但其成功與否高度依賴于企業自身的技術實力、風險承受能力以及對總擁有成本的綜合考量。對于大多數企業而言,這并非一個更便宜的選項,而是一個將更多責任和控制權攬入懷中的選擇,需要慎之又慎。
2. 國內數據庫開源觀察
2.PNG
這是來自2023年艾瑞收集的國產數據庫情況,其中部分開源項目已經不活躍了。下面我收集了部分國產主流開源數據庫的情況,通過表格形式體現。需要說明的是,特增加了開源指標和活躍度兩個指標。前者是開源項目常見指標(Stars,Forks,Contributors),可以大體反映開源項目發展程度;后者通過開源項目的變化情況(Active PR/Month,Active Issue/Month)在一定程度上反映開源項目的活躍度。此外,有的開源項目有多個開源地址,這里主要選取Github的數據,如沒有則選擇其他開源托管平臺如Git的數據。
3.png
觀點:項目參差不齊,活躍差異巨大
國產數據庫開源領域呈現出顯著的“冰火兩重天”景象,項目之間的數量級差異巨大,反映出社區影響力和開發活躍度的高度不均衡。這種差異不僅體現在表征受歡迎程度的Star數量上,更關鍵地體現在反映實際開發活力的PR、Fork、Issue等動態指標上。一方面,頭部項目已經具備了國際級的社區影響力與活躍度。以 TiDB 為例,其Star數一騎絕塵,遠超其他項目,同時PR、Fork、Issue的數據,構成了一幅健康、活躍的開源項目圖景,表明有一個龐大的開發者社區在持續為其貢獻代碼、報告問題并參與協作。類似地,Milvus、TDengine、OceanBase等項目,不僅在知名度上領先,更在實質性的社區協作上表現出強勁勢頭。這些項目通常由成熟的團隊運營,有清晰的版本迭代路線圖和活躍的社區溝通渠道。另一方面,大量項目的活躍度則處于較低或甚至停滯狀態。這種差距觸目驚心,有些項目其Star數僅為個位數,PR、Fork、Issue數長期很低,這通常意味著項目可能已無人維護或僅作為代碼存檔開放。這種巨大的差異揭示了開源世界的殘酷現實,僅僅開源代碼并不足以成功,持續的社區運營、技術布道和商業支持才是維持項目生命力的關鍵。用戶在選型時,絕不能僅憑Star數做判斷,必須綜合考察PR、Issue、版本發布頻率等動態指標,以避免選用一個“僵尸項目”。
觀點:新興數據庫類型更為活躍
從數據中可以清晰地觀察到,國產開源數據庫的活力正從傳統的關系型數據庫領域,向時序、向量、圖、OLAP等新興和專業型數據庫轉移。這些賽道由于切中了AI、物聯網、實時分析等當下最前沿的技術趨勢,獲得了開發者社區和資本市場的雙重青睞,表現出更高的活躍度和關注度。傳統關系型數據庫雖然項目數量眾多,但除個別明星項目外,整體面臨的競爭壓力巨大。 在PostgreSQL和MySQL衍生品陣營中,只有 TiDB、OceanBase、IvorySQL等少數幾個在分布式架構上取得突破的項目脫穎而出,獲得了現象級的關注;而其他許多同類項目社區指標相對平淡。這表明,在高度成熟的關系型數據庫市場,除非有顛覆性的技術優勢或強大的生態背書,否則新項目很難吸引到廣泛的社區注意力。相比之下,面向特定場景的新興數據庫則表現出了驚人的爆發力。如Milvus,受益于當前大模型和AI應用對向量檢索的迫切需求,非?;馃?。其他如時序數據庫領域的 TDengine 和 Apache IoTDB,也因其在物聯網、工業制造等場景下的高效能而備受關注。在OLAP領域,Apache Doris 和 StarRocks 作為實時分析引擎的后起之秀,社區活躍度非常高。
觀點:開源協議多樣化,商業化考量明顯
國產開源數據庫在開源協議的選擇上呈現出明顯的多樣性,這背后反映了項目主導方對于知識產權、商業模式和社區推廣的不同戰略考量。協議選擇不再是單純的技術或法律問題,而是與項目的商業化路徑緊密相連的戰略決策。Apache-2.0協議成為絕對主流,體現了“開放核心”或云服務商業模式的偏好。在列表中的眾多項目中,如TiDB、PolarDB-PG、PolarDB-X、Apache Doris、TDengine、Milvus、Databend等均采用Apache-2.0協議。該協議非常寬松,允許用戶自由使用、修改和分發軟件,甚至用于商業閉源項目,這極大降低了開發者的使用門檻,有利于快速構建社區和生態。對于項目方而言,這種寬松性為其“開放核心”(Open Core)商業模式奠定了基礎,即核心代碼開源,但高級特性、企業級功能或托管服務(通常以云服務形式)則需付費。阿里云、百度飛輪科技等公司的項目多采用此協議,其最終目的是通過開源吸引用戶,并導向其商業云服務。
存在使用Copyleft協議的項目,旨在保護知識產權并促進協作。例如,GreatSQL 和 AliSQL 選擇了 GPL-2.0協議,openHalo使用了 GPL-3.0 協議。GPL系列協議具有“病毒式”傳播特性,要求任何修改后的衍生作品也必須以相同協議開源。這在一定程度上可以防止其他公司直接將其代碼閉源商業化,保證了項目的主導權。TDengine社區版采用了更強的AGPL-3.0協議,該協議對云服務提供商有更嚴格的限制,是項目方在云時代保護自身商業利益的一種常見策略。另一方面,華為的 openGauss 和天翼云的 openTeleDB 則選擇了中國本土的MulanPSL-2.0(木蘭寬松許可證),它與Apache-2.0類似,是寬松協議,體現了對國產開源協議的支持。
協議的選擇直接影響了項目的采用和商業化路徑。 寬松協議項目更易被廣泛采用和集成,但競爭也更激烈;Copyleft 協議項目能更好地控制代碼分支,但可能嚇退一些尋求專有集成的商業用戶。從數據看,國產開源數據庫主導方已經非常成熟和理性地運用開源協議這一工具,在“構建開放社區”和“實現商業回報”之間尋求最佳平衡點。這種多樣化的協議格局,正是國內開源商業生態逐步成熟的體現。
3. 國產開源數據庫盤點
下面羅列下國內主要的開源數據庫。說明下,順序不代表排名。
IvorySQL
https://www.ivorysql.org/zh-cn/
https://github.com/IvorySQL/IvorySQL
IvorySQL是先進的、功能齊全的開源兼容Oracle的PostgreSQL數據庫,并堅定地承諾始終保持100%兼容并直接替換最新的 PostgreSQL。IvorySQL添加了一個“compatible_db”切換開關以在Oracle和PostgreSQL兼容模式之間切換。IvorySQL的一大亮點是支持oracle的PL/SQL語法和Oracle風格包的PL/SQL過程語言。該項目已捐贈給開放原子開源基金會。
4.png
openTeleDB
https://github.com/OpenTeleDB/OpenTeleDB
OpenTeleDB 基于 PostgreSQL 17 開發,PostgreSQL 是一個開源的對象關系型數據庫系統,以健壯性、完整性、功能強大著稱。它支持復雜的查詢,外鍵,事務完整性,MVCC。其架構由后端(處理數據存儲,查詢和事務)和前端(客戶端應用與數據庫交互)組成。OpenTeleDB 新增三大特性,XProxy、XStore和XRaft。XProxy 是針對高并發、大規模連接場景下數據庫性能瓶頸與運維復雜性問題所孵化的自主創新解決方案,旨在應對傳統數據庫在短連接高頻訪問下連接開銷大、并發能力受限、讀寫分離實現復雜等挑戰。XStore 是針對高并發的OLTP場景、要求性能穩定的業務所設計的原位更新存儲引擎。XRaft 是針對傳統數據庫高可用架構中數據一致性風險與腦裂問題所孵化的自主創新解決方案,旨在應對主備切換時日志分叉引發全量重建、故障轉移依賴外部仲裁導致系統性風險等核心挑戰。
5.png
openHalo
https://github.com/HaloTech-Co-Ltd/openHalo
openHalo 能夠理解 MySQL 的 SQL 方言,并支持相同的通信協議,MySQL 編寫的應用程序只需進行少量甚至無需任何代碼更改即可與 openHalo 兼容。這樣一來,將運行在 MySQL 5.7 或更高版本上的應用程序遷移到 openHalo 所需的工作量大大減少,從而實現更快、風險更低、成本更低的遷移。
6.png
openGauss
https://gitcode.com/opengauss/openGauss-server
https://github.com/opengauss-mirror/openGauss-server
openGauss 基于C++語言實現,重點面向企業級應用場景提供數據管理服務。該系統采用多核架構性能優化、全密態計算安全機制及AI智能調優技術,支持一主多備架構與最多八個備機的部署模式,適用于金融、通信等高并發場景。開源后與130余家合作伙伴共建社區,2023年開發者大會推出DataPod+DataKit組合及第三代智能優化器ABO,并發布數據庫一體機產品。累計裝機量突破10萬臺,線下集中式新增市場份額達30.2%,基于該技術的產品占比超過MySQL和PostgreSQL,成為主流開源技術路線之一。其技術特性包括故障切換時間10秒內、兩路鯤鵬處理器性能達150萬tpmC,提供端到端安全防護及AI智能參數調優能力。2024年開源數據庫項目獲中國通信學會科學技術獎一等獎,并獲得首個自主創新數據庫根社區認證證書。
7.png
PolarDB-PG
https://github.com/ApsaraDB/PolarDB-for-PostgreSQL
PolarDB for PostgreSQL是一款阿里云自主研發的云原生數據庫,100% 兼容 PostgreSQL,采用基于 Shared-Storage 的存儲計算分離架構,具有極致彈性、毫秒級延遲、HTAP 的能力。PolarDB for PostgreSQL 采用了基于 Shared-Storage 的存儲計算分離架構。數據庫由傳統的 Shared-Nothing 架構,轉變成了 Shared-Storage 架構。由原來的 N 份計算 + N 份存儲,轉變成了 N 份計算 + 1 份存儲。雖然共享存儲上數據是一份,但是數據在各節點內存中的狀態是不同的,需要通過內存狀態的同步來維護數據的一致性;同時主節點在刷臟時也需要做協調,避免只讀節點讀取到超前的 “未來頁面”,也要避免只讀節點讀取到過時的沒有在內存中被正確回放的 “過去頁面”。為了解決該問題,PolarDB 創造性地設計了 LogIndex 數據結構來維護頁面的回放歷史,該結構能夠實現主節點與只讀節點之間的同步。在存儲計算分離后,I/O 單路延遲變大的同時,I/O 的吞吐也變大了。在處理分析型查詢時,僅使用單個只讀節點無法發揮出存儲側的大 I/O 帶寬優勢,也無法利用其他只讀節點的 CPU、內存和 I/O 資源。為了解決該問題,PolarDB 研發了基于 Shared-Storage 的并行執行引擎,能夠在 SQL 級別上彈性利用任意數目的 CPU 來加速分析查詢,支持 HTAP 的混合負載場景。
8.png
openTenBase
OpenTenBase 是企業級分布式數據庫 TDSQL 的社區發行版,包含 OpenTenBase 和 TXSQL 雙內核,具備高擴展性、商業數據庫語法兼容、分布式引擎、多級容災和多維度資源隔離等能力,成功應用在金融、醫療、航天等行業的核心業務系統。一個 OpenTenBase 集群由多個 CoordinateNodes、DataNodes 和 GTM 節點組成。所有用戶數據都存儲在 DataNodes 中,CoordinateNode 僅包含元數據,GTM 用于全局事務管理。CoordinateNodes 和 DataNodes 共享相同的模式。2023年12月16日,騰訊云將企業級分布式數據庫TDSQL的社區發行版 OpenTenBase 正式捐贈給開放原子基金會。
9.png
OceanBase
https://github.com/oceanbase/oceanbase
OceanBase 是一個金融級原生的分布式關系數據庫,始創于 2010 年,并于 2021 年 6 月正式開源。它具有數據強一致、高可用、高性能、在線擴展、高度兼容 SQL 標準和主流關系數據庫、低成本等特點。OceanBase 為現代數據架構打造的開源分布式數據庫。兼容 MySQL 的單機分布式一體化國產開源數據庫,具有原生分布式架構,支持金融級高可用、透明水平擴展、分布式事務、多租戶和語法兼容等企業級特性。
10.png
TiDB
TiDB 是由 PingCAP 公司自主設計、研發新一代數據庫,早在 2015 年便已開源。它是一款同時支持在線事務處理與在線分析處理 (Hybrid Transactional and Analytical Processing, HTAP) 的融合型分布式數據庫產品。
11.png
GreatSQL
https://gitee.com/GreatSQL/GreatSQL
GreatSQL 數據庫是一款開源免費數據庫,可在普通硬件上滿足金融級應用場景,具有高可用、高性能、高兼容、高安全等特性,可作為 MySQL 或 Percona Server for MySQL 的理想可選替換。
AliSQL
https://github.com/alibaba/AliSQL
AliSQL 是阿里巴巴集團開發的 MySQL 分支數據庫。它基于 MySQL 官方版本,并進行了諸多功能和性能方面的增強。AliSQL 已在生產環境中證明了其穩定性和高效性。它可以作為 MySQL 的免費、完全兼容、功能增強且開源的替代方案。AliSQL自2016年8月起便是一個開源項目,由阿里巴巴集團的工程師積極開發。此外,它還整合了來自Percona、WebScaleSQL和MariaDB的補丁。
PolarDB-X
https://github.com/polardb/polardbx-sql
PolarDB-X 是一款面向超高并發、海量存儲、復雜查詢場景設計的云原生分布式數據庫系統。其采用 Shared-nothing 與存儲計算分離架構,支持水平擴展、分布式事務、混合負載等能力,具備企業級、云原生、高可用、高度兼容 MySQL 系統及生態等特點。
12.png
Apache Doris
https://github.com/apache/incubator-doris
Apache Doris 是一款基于 MPP 架構的易用型、高性能實時分析數據庫,以其極快的速度和易用性而著稱。即使在海量數據下,它也能以亞秒級的響應時間返回查詢結果,不僅支持高并發點查詢場景,還能支持高吞吐量的復雜分析場景。所有這些都使得 Apache Doris 成為報表分析、即席查詢、統一數據倉庫和數據湖查詢加速等場景的理想工具。在 Apache Doris 上,用戶可以構建各種應用程序,例如用戶行為分析、A/B 測試平臺、日志檢索分析、用戶畫像分析和訂單分析。
13.png
StarRocks
https://github.com/StarRocks/starrocks
StarRocks 是全球速度最快的開放式查詢引擎,支持亞秒級即時分析,無論是在數據湖屋內外,都能流暢運行。其平均查詢性能比其他常用方案快 3 倍,無需反規范化即可適應您的各種用例,無需遷移數據或重寫 SQL。StarRocks 是一個 Linux 基金會項目。
14.png
TDengine
https://github.com/taosdata/TDengine
TDengine 是一款開源、高性能、云原生、AI 驅動的時序數據庫 (Time-Series Database, TSDB)。TDengine 能被廣泛運用于物聯網、工業互聯網、車聯網、IT 運維、金融等領域。除核心的時序數據庫功能外,TDengine 還提供緩存、數據訂閱、流式計算、AI 智能體等功能,是一極簡的時序數據處理平臺,最大程度的減小系統設計的復雜度,降低研發和運營成本。
Apache IoTDB
https://github.com/apache/iotdb
IoTDB (Internet of Things Database) 是一款時序數據庫管理系統,可以為用戶提供數據收集、存儲和分析等服務。IoTDB由于其輕量級架構、高性能和高可用的特性,以及與 Hadoop 和 Spark 生態的無縫集成,滿足了工業 IoT 領域中海量數據存儲、高吞吐量數據寫入和復雜數據查詢分析的需求。 更多功能請見時序數據庫IoTDB:功能詳解與行業應用。IoTDB 依賴 TsFile 項目,它是一種專門用于時序數據管理的文件格式。
Nebula
https://www.nebula-graph.com.cn/
https://gitee.com/vesoft-inc/Nebula
Nebula 是一個分布式、可擴展的開源圖數據庫,擅長處理千億個頂點和萬億條邊的超大規模數據集,公司創始團隊來自于 Facebook、阿里巴巴、華為等國內外各大知名公司。
15.png
MatrixOne
https://github.com/matrixorigin/matrixone
MatrixOne 是業界首個將 Git 風格版本控制引入數據庫的產品,同時具備 MySQL 兼容、AI 原生和云原生架構。作為一款 HTAP(混合事務/分析處理)數據庫,MatrixOne 采用超融合的 HSTAP 引擎,在單一系統中無縫處理事務型(OLTP)、分析型(OLAP)、全文檢索和向量檢索等多種工作負載——無需數據遷移、無需 ETL、無需妥協。
16.png
Milvus
https://github.com/milvus-io/milvus
Milvus是一個專為大規模應用而構建的高性能向量數據庫。它能夠高效地組織和搜索海量非結構化數據(例如文本、圖像和多模態信息),從而為人工智能應用提供支持。Milvus 使用 Go 和 C++ 編寫,并實現了 CPU/GPU 硬件加速,從而提供一流的向量搜索性能。憑借其完全分布式且原生于 Kubernetes 的架構,Milvus 可以橫向擴展,處理數十億個向量上的數萬個搜索查詢,并通過實時流式更新保持數據最新。
SequoiaDB
https://github.com/SequoiaDB/SequoiaDB
SequoiaDB 巨杉數據庫是一款分布式文檔型數據庫,自研的原生分布式存儲引擎支持完整ACID,具備彈性擴展、高并發和高可用特性,并以文檔型 JSON 的半結構化數據格式為基礎,兼容S3對象數據引擎接口,進一步形成Multi-Model多模數據處理能力,可支持跨結構化、半結構化和非結構化的多模數據處理。適用于歷史數據平臺、全量數據平臺、實時數據中臺和內容數據管理平臺等各類應用場景。
Databend
https://github.com/databendlabs/databend
Databend 是一個開源的Elastic和Workload-Aware現代云數據倉庫。Databend 是一款強大的云數倉,專為彈性和高效設計,自由且開源。它是 Snowflake 的開源替代品,也可在云中使用。Databend 使用最新的矢量化查詢處理技術,讓您可以在對象存儲( S3、Azure Blob、谷歌云存儲、華為云 OBS或MinIO)上進行超快的數據分析。
17.png
17.png



























