题图:来自unsplash(Micheile)

上篇《资本为什么会盯上国产数据库》,老鱼从宏观层面谈了原因,如:市场够大、增速很快、需求拉动、政策利好等。本篇,老鱼想从微观角度,也就是从某一具体数据库厂商获得融资的角度进一步聊聊资本为什么盯上国产数据库。

承接上篇,还是拿Snowflake举例……

2020年9月16日,Snowflake正式在纽约证券交易所上市,上市当天Snowflake发行价为120美元,收盘时股价飙升111.61%为253.93美元,市值707亿美元。

一年零两个月后,也就是2021年11月16日,Snowflake收盘价为401.89美元,市值高达1209亿美元。


在DB-Engines的排名,Snowflake也从去年9月的107位快速爬升到目前的18位,排名上升了89位。

Snowflake不仅创造了史上规模最大的软件IPO,一跃成为数据库圈乃至科技圈最爆款的新闻之一,也成功的佐证了云原生数据仓库的商业价值。这很重要,因为过去相当长的时间,很多人(包含圈内人士)都认为做数据库,OLTP是比OLAP更好的生意,而Snowflake则打破了这种认知。

Snowflake的成功,也让对标Snowflake的国产数据库厂商骤然多了起来。

偶数科技就是其中一家,也是老鱼认为最像Snowflake的一家,二者都是以OLAP云数仓为主赛道,都是独立云数仓服务商支持多云部署。

2021年8月,偶数科技宣布完成近2亿元的B+轮融资,这是自2016年底偶数科技成立以来第四轮融资。看看其背后的投资方,红点中国,红杉中国,金山云、腾讯,阵容堪称豪华。

资本为什么会盯上偶数科技?毫无疑问的一点,没有良好的业务增长,是很难融到B轮的,B+轮腾讯入场也证明了偶数科技云数仓头部厂商的地位,因为腾讯本身在数据库领域就深耕已久。具体从赛道、技术、市场来一一分析。

看赛道:云数仓(OLAP)赛道足够宽,Snowflake 1200亿美元市值已经证明云数仓是门好生意。看需求,国产化和数字化建设会带动国产数据库需求的爆发式增长,这点毫无疑问。更为关键的是,数据库是基础设施,属于“卡脖子”的核心产品和技术,国家大力鼓励国产数据库厂商的发展,政策风险低。

看技术:就不得不提Apache HAWQ,这应该是国内最早的数据库顶级项目,该项目的创始人常雷,曾任EMC高级研究员、EMC/Pivotal研发部总监,现任偶数科技创始人&CEO。

常雷是北大计算机系博士,毕业后供职于 EMC,2011 年某天,常雷在一个研究课题中提出了新一代SQL引擎,用于解决Hadoop在性能方面的缺陷,这个引擎成为了HAWQ的前身。也就在这一年,EMC收购了Greenplum,常雷加入 Greenplum 部门并组建数据库团队将HAWQ产品化。2015年,HAWQ 捐赠到Apache基金会。2016 年,常雷离开 EMC,创立了偶数科技。

Apache HAWQ是一个Hadoop原生SQL查询引擎,是以Greenplum Database 为代码基础逐渐发展起来的,采用MPP架构。怎么理解?

OLAP数据仓库领域有2个流派,一个是MPP派,一个是Hadoop 派,Hadoop派的缺点是很慢,但支持的节点规模要大于MPP。而MPP派就比较快了,兼容性较好,并且能兼容传统数据库,如Greenplum、Teredata等。但扩展性不太好,节点规模只能支持到几百个节点,数千个节点就有点困难了。

Apache HAWQ做的就是结合了二者的优势,把存储构建在分布式文件系统 HDFS 之上,实现存储和计算的分离,不仅解决了 Hadoop 的性能问题,同时也解决了MPP架构的可扩展性瓶颈,具有非常成熟的并行优化器等。

偶数科技核心产品OushuDB就脱胎于Apache HAWQ,使用了存算分离和多计算集群架构,重写了执行引擎和底层存储,所以,各方面要优于HAWQ。偶数官方数据显示,OushuDB比Apache HAWQ性能高出5-10倍。

谈到OushuDB的技术优势,常雷表现的有些“云淡风轻”,“原创性的技术是我们最核心的优势,就是你比别人的产品好,而且也达到一定数量级,这时候它就是别人不可比拟的优势。”

常雷表示,OushuDB技术特性有很多,比如:云原生、高性能、多云、纯国产、强兼容等。在常雷看来,要做到云原生数据库,就必须要做到存储和计算的完全分离以及执行引擎的完全弹性。

OushuDB的多云特性与Snowflake还有些不同,除了支持 AWS、Azure、阿里云、腾讯云、金山云等公有云的统一数据管理方案,也可结合私有云进行混合管理。而Snowflake是彻底跑在公有云上的数据仓库。

后一点在中国市场很重要,在中国市场,传统企业尤其是国企和金融企业,更信赖私有云,这点与国外不同。如果不能结合私有云进行混合管理,那在国内客户群将会大大减少。

投资方金山云团队表示:“偶数是数据库领域的佼佼者,公司新一代云原生数据库在性能和功能等方面有着极大的技术优势。”

投资方红点中国执行董事刘岚表示:“源自于Apache开源社区的偶数,是中国云原生数据仓库的先行者”

最后看市场,在对数据库要求最苛刻的金融行业里,偶数科技的发展速度和成果似乎有些不可思议,偶数科技与四大行之一的建设银行共同成立了高性能大数据处理技术实验室,融合建行数十PB的海量数据应用场景和偶数的数据库创新能力,共同打造新一代云数据仓库CHAWQ,用于建行数据湖等大规模核心数据处理场景。2021年中,在建设银行数据湖项目中,CHAWQ成功进行了实践应用。

浙商银行基于OushuDB构建了全行级数据平台,替代了传统DB2数据仓库和Oracle数据集市,支撑了管会、反欺诈、客户画像、绩效考核、跑批、监管报送等应用。

更让人意外的是,偶数科技还是国内少数把数据库卖到了美国的厂商之一,而且还是卖给全球软件巨头VMware。

常雷说,“我们的标杆客户中,一个非常有代表性的是美国的 VMware。首先,数据库作为刚需核心应用,涉及到企业数据管理最关键的存储环节。VMware 选择采购中国公司的产品,这本身就是一种突破;第二,VMware 是全球计算机软件巨头,本身拥有很强大的云计算团队,也很了解云原生数据库,选择 OushuDB 之前经历过严格的产品试用和采购评估环节。拿下 VMware 是偶数在获客道路上一次里程碑式的事件”。

红杉资本中国基金董事总经理翟佳表示:“数字化转型是近两年金融、政府以及中大型企业绕不开的一个话题,数据库作为数字化转型的基础重要性不言而喻。同时,数据量的爆发和业务场景的分析多样化对数据库的性能、扩展能力也提出了更高的要求。另外,自主创新也是一个潮流和趋势。偶数和建设银行成立的高性能大数据联合实验室,是金融行业数据库基础架构建设的方向标。同时,偶数的新一代云数据库OushuDB还在金融、电信、公安、能源等领域的头部客户得到了广泛的应用。我们长期看好偶数的发展潜力。”

目前,偶数科技客户群分布在金融、运营商、能源和政府等多个行业。也许从成立时间和融资轮次来说,偶数科技不如PingCAP,星环科技那么早那么多,但前两者一个主打HTAP,一个主打大数据基础平台,如果从云数仓赛道来看,偶数科技是无疑的拔尖的那位。

来源:老鱼笔记