新闻动态 > 艾瑞咨询中国数据库行业研究报告正式发布,湖仓一体架构获业界认可

艾瑞咨询中国数据库行业研究报告正式发布,湖仓一体架构获业界认可

 2021-08-13

上周,艾瑞咨询首次发布中国数据库行业研究报告。《2021年中国数据库行业研究报告》梳理了各种类型数据库的技术架构和适用场景,从供需双方视角分析了中国数据库市场的存量增量、市场格局、选型指标以及行业典型应用实例,并基于上述研究讨论了数据库市场的挑战与未来趋势。



《2021年中国数据库行业研究报告》中指出,“政策和数字化持续释放需求,中国数据库市场进入百花齐放的快速发展期。2020年,国内数据库市场总规模达247.1亿元,较2019年增长16.2%,CAGR(2020-2025e)达15.6%,未来三年预计将保持高增长。国产数据库在分布式改造、国产化、数据迁移、跨库管理、软硬结合等多方面仍面临挑战,湖仓一体、DBaaS等五大趋势将成为中国数据库市场未来发展的必然趋势。”



image.png


SequoiaDB 巨杉数据库的湖仓一体融合数据平台入选该报告的典型厂商案例。基于「湖仓一体」架构,巨杉数据库打通了不同业务类型、不同数据类型之间的技术壁垒,实现交易分析一体化、流批一体化、多模数据一体化,最终降低数据流动带来的开发成本及计算存储开销,提升企业运作的“人效”和“能效”。


duo


image.png


Cloudera退市,湖仓一体或引领大数据的下半场

同样是在上周,据 TechCrunch 报道,KKR 和 CD&R 将以 53 亿美元收购 Cloudera,Cloudera 将私有化。2008年,Hadoop 顺利通过孵化器成为 Apache 的顶级项目,包含众多子项目。同年,第一家 Hadoop 商业化公司 Cloudera 成立,创始人来自 Google、FaceBook 和 Yahoo!。随着不断发展和融资,Cloudera 在 2014 年的市值达到近50亿美元的顶峰,是Hadoop生态系统中规模最大、知名度最高的公司。在 Hadoop 最鼎盛的阶段,几乎所有公司的大数据平台都使用了Cloudera、Hortonworks 和 MapR 的 Hadoop 发行版。但随着Hadoop逐渐受到公有云和数据湖等技术的冲击,Cloudera 的股价也随之不断缩水。2018年 Cloudera 宣布与 Hortonworks 合并,但这并未挽救颓势。2021年4月 Apache 宣布关闭13个与大数据有关的 Apache 项目,其中10个项目属于 Hadoop 生态系统,如今 Cloudera 也即将私有化,这也许代表着 Hadoop 已辉煌不再,那么谁将引领大数据的下半场?


 
同时,艾瑞咨询《2021年中国数据库行业研究报告》指出,“1980s以来,数据仓库技术不断发展,尤其MPP架构使得DBMS能够处理大量数据,满足企业通过数据分析来支持商业决策的需求。但随着互联网的发展,许多企业需要同时处理非结构化数据,半结构化数据以及海量结构化数据。数据湖随之诞生,它可以直接存储各种格式的原始数据,根据用户需求进行计算,具有灵活弹性的优点。但是,数据湖虽然适用于存储多元化数据,却缺少一些企业级功能,在实际执行时也存在许多挑战:数据缺少加工,难以实现实时分析,数据查询性能差;不支持ACID事务等。而湖仓一体实现架构创新,作为中国数据库行业市场新趋势之一,能够同时实现海量大数据的联机交易和联机分析。”



image.png


面对海量大数据场景下的联机交易、非结构化数据治理等需求,以及数据仓库和数据湖存在的不足,以Snowflake、Databricks及巨杉数据库为代表,聚焦于新一代“湖仓一体”架构的数据库厂商,开始在面向全新海量联机业务的场景中快速崛起。“湖仓一体”由数据湖和数据仓库概念延伸而来,融合了两者的架构特性。在传统独立构建数据湖及数据仓库模式的基础上,“湖仓一体”演进出对不同数据类型(结构化、半结构化与非结构化)的存储和联机处理能力,为企业提供裸数据存储、数据加工、数据分析展现等能力的统一平台。


 
在巨杉数据库的典型应用架构中,企业通常基于其产品「湖仓一体」的架构特性,构建数据基础设施平台型,以整合以往分散管理的结构化、半结构化和非结构化数据。巨杉数据库充分兼容包括:MySQL、MariaDB、PostgreSQL、Apache Spark、S3、NAS、SDB API在内的多种接口,其特有的跨引擎事务一致性能力,可以有效简化多团队开发流程中对不同引擎及结构的ACID管理,提升业务开发、数据处理、运维管理多方面提升企业的综合数据管理效率,避免了传统数据湖、数据仓库独立建设带来的ETL延迟及数据冗余存储,降低了技术栈的复杂性。另外,该平台提供丰富的生态对接,支持包括Tableau、Power BI、帆软、SmartBI等国内外分析工具,提供数据分析报表、商业智能决策等。



image.png

相比数据湖,巨杉数据库湖仓一体架构能够支撑联机交易和联机分析的场景,弥补了通过Hadoop技术在数据库实时处理能力方面的重大不足。随着企业数字化转型的深化,尤其是在数据中台、智能化应用进行微服务改造的过程中,企业内部出现了大量需要同时访问多个不同业务系统(几个到几百个)数据的联机交易场景,底层数据库具备大规模实时联机处理能力显得尤其重要。


 
相比数据仓库,巨杉数据库湖仓一体架构作为支持联机处理的统一数据底座,多类型的可以实时打通,避免不同平台间的数据移动,大大降低了数据处理的时间成本。企业可以对不同岗位的研发及业务人员开放自由查询能力,无需通过IT部门人员进行复杂建模,大大提升了应用开发的敏捷性,让业务从T+1走向T+0。
 
基于湖仓一体架构,巨杉数据库提供对机器学习和AI算法的支持,实现数据湖+数据仓库的闭环,极大地提升业务的效率,有效帮助企业增强数据复用能力,全方位提升管理及开发效率。