上个月,国家东数西算战略正式启动,国家发展改革委、中央网信办、工业和信息化部、国家能源局联合印发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计。

东数西算的核心思想其实就是因地制宜,在合适的地理环境中实现数据存储和计算的最优解。这与数据库存算分离架构的思想不谋而合。

如何理解“东数西算”

“东数西算”中的“数”指的是数据,“算”指的是算力,即对数据的处理能力。

算力已成为数字经济发展的核心生产力,是国民经济发展的重要基础设施。“东数西算”就是通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。

简单地说,就是让西部的算力资源更充分地支撑东部数据的运算,更好为数字化发展赋能。


东数西算的8大算力枢纽及任务分配

“东数”为什么要“西算”

不间断供电是全球IDC成本的重灾区,因此减少IDC数据中心供电成本、节约能耗是新时代绿色数据中心的发展需求。目前,我国数据中心大多分布在东部地区,由于土地、能源等资源日趋紧张,在东部大规模发展数据中心难以为继。而我国西部资源充裕,特别是可再生能源丰富,具备发展数据中心,承接东部算力需求的潜力。


“东数西算”与“存算分离”

国家东数西算政策明确指出了西部数据中心负责处理后台加工、离线分析、存储备份等业务,这就意味着未来将会有海量数据依托于西部数据中心进行离线乃至实时的数据分析处理,这个背景下存储和计算分离将成为常态。

然而,目前的主流数据库无论是MPP、Hadoop,还是传统事务性数据库都要求在同一个基础设施进行数据存储和计算,存算无法分离,地理位置则更难以分开,地理的同一性要求很高。


另外一个不能忽视的问题就是,在东数西算战略下数据不断增长,为了保证集群未来长期可用,项目设计之初通常不得不留出很大的存储和计算冗余,在数据规模接近资源边界之前,数据中心的资源都一直处于未完全利用的状态,这就造成了早期投资的浪费,而随着数据中心的数据规模或者应用场景增多,往往是计算资源提前耗尽而无法有效支持业务场景。


“存算分离”破局之道

基于存算分离架构设计理念,偶数科技的新一代云原生数据仓库OushuDB不仅做到了真正的存算分离,同时还实现了实时动态弹性扩容,采用OushuDB的数据中心可以在早期按需投入资源进行数据处理,随着数据规模和场景增多,动态扩展计算或者存储资源进而高效、不间断的支持数据处理场景。这意味着基于OushuDB的东数西算项目无论在落地之初还是长期运营都能保证资源合理利用。


除了长期的资源合理利用,短期内根据数据处理需求动态调整资源配置也是OushuDB为用户带来一大创新体验。不同时段的资源利用水平和需求也不一样,比如白天和夜晚、工作日和休息日,平台资源可能处于不同程度的闲置状态,这让我们可以为一些特定的数据分析处理需求倾斜资源以提高效率。举一个例子,某一个重要的分析查询使用10个计算节点需要跑1个小时,如果使用100个节点的话,同样一个查询大约只需要跑6分钟,在东数西算背景下的数据中心这两种硬件配置成本是大致相同的,但是效率却可以提高10倍。

       

        

因此,在东数西算的大背景下,数据仓库作为基础软件,首先需要做到存储计算分离,才能实现不同地理位置中资源的最大化利用。其次高效的使用资源还必须从弹性扩容缩容出发,云原生技术在弹性扩容具备天然优势,这也是为什么国外各大云厂商都和独立数据库厂商都角力云原生数据仓库。但在具体的资源供给和计费方面,各个厂商的表现却有差异,比如计算资源弹性及计费方面,国外厂商起步较早,国内云厂商的分析型数据库目前都不支持计算资源的单独配置和计费。相较于云厂商,云中立的数据库厂商比如偶数的OushuDB则更专注在云原生数据库的技术创新和产品打磨。

“东数西算”政策下国产数据库软件机遇

“东数西算”通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。因此,中国完全自主知识产权的高性能分布式数据库将成为“东数西算”最重要的核心基础软件。

 “东数西算”作为我国战略级工程,要求不管是数据的存储还是数据的处理能力,必须自主可控。同样,作为承载数据存储和数据处理的数据库也必将成为东数西算战略的中坚力量。



当前市场上真正拥有完全自主知识产权国产数据库可谓是凤毛麟角。偶数科技自主研发的OushuDB 包揽了国内外权威测试与认证,是目前国内少有的、真正意义上的、完全自主知识产权的国产数据库。


据不完全统计,在当前国家推动信创和国产化替代进程中,浮现出大量基于国外开源软件的二次开发,所谓的“自主知识产权基础软件”渗透到国内很多行业的关键信息基础设施中。假国产和伪创新的野蛮生长不仅会在长期造成重大的安全隐患,也给真正的自主知识产权和科技创新带来巨大伤害,阻碍了中国软件企业走向世界的健康发展道路。所以真国产无论在东数西算战略下还是科技产业自主可控的长期道路上,都显得尤为重要。