达梦数据:开源盛行的今天,为什么数据库自主研发显得尤为重要?

12月14日,"2022全国网民网络安全感满意度调查报告发布周"《网络安全行业发展专题报告》发布会成功举办,面向全社会正式发布了报告,其中重点关注了信息技术产品自主、可控生态,以及关键产品的国产化配套成效。

在网络安全领域,软件的"开源"和"闭源"是无法回避的基础问题。我国是开源软件使用大国,对于使用开源技术可能带来的网络安全风险值得人深省。作为基础软件领域的国产厂商,达梦数据一直坚持自研关键技术不动摇,持续完善和优化产品,这与市场上众多基于开源产品推出的数据库形成鲜明对比。

一直以来,业界对开源和闭源的关注和争议不断,如何正确看待开源技术、使用开源可能存在哪些风险、在以数据库等为代表的基础软件产业我们是否应该坚持自研,聚焦这些热点问题,我们一起来探讨。

如何正确看待开源技术?从技术本身而言。借助开源我们能做到很多东西,但同时也要避免"依赖开源"的情况。中国的基础软件产业里面做自主化,走开源路径就要思考应该规避哪些问题,同样也要设计机制避免"依赖开源"。借助开源,能够获取源代码,但仅仅拥有源代码不代表拥有核心技术。试想在数据库或者操作系统这样上千万行代码规模的内核中,被有意或无意的"投毒",会是一件毛骨悚然的事情,大海里捞一根针都很难,更何况是在毫无察觉的情况下安插一个漏洞,因此这样的风险是非常大的。

基于开源技术开发的数据库存在怎样的风险?从开源技术主营地开源社区分析。开源社区本身作为一个跨国界的组织,成员来自世界各地,这其中的协调无关国界,而是个体与个体之间的协调,也就是所谓的"国际分工"。但是当国际壁垒建立起来了,国际分工不复存在,这时最关键的就是开源社区的源头。开源社区的源头和厂商处于同一个阵营,那么协调起来相对来讲比较容易。

这相当于分辨行业一个上下游的关系,上游是开源社区,下游是基于开源的厂商。如果这个开源上游是在美国或者欧洲,下游在国内的市场的风险将会非常大。如果上下游都在国内,风险会相对小一些。举个例子,比如长江的源头与入海口都在中国境内,那么各省市之间规划修建水坝、开闸放水等都可以合理协调。

开源or自研,掌握核心技术是关键。近年来,中国出现大量基于开源的数据库厂商,这是时代背景下,开源运动作为基本条件,并在一定的投机因素作用下出现的必然结果。市场规模是有限的,市场发展也有其必然规律,相信经过一段的时间后会大幅收敛。恰恰是这种现状下,我们更需要自研核心技术。从大的方面来看,目前的国际环境演变足以证明,供应链安全无关乎开源还是商业,在极端情况下,无论是使用商业产品还是开源代码,都面临着相同的境地,只与核心技术掌握在谁的手里有关,而不仅仅是掌握源代码。脱离了技术主导者,即便拥有源代码,也无法持续发展。我们认为这也是中国大量的数据库厂商的短板所在——有代码而无技术,始终无法断奶。从这个角度来看,自研并掌握核心技术,更加具有意义。

从小的方面看,大量基于同一开源代码基础而形成的产品,难以产生差异化竞争优势。如果仅仅将自己定位成某种开源社区发行版的技术服务提供商的话,是很难提供充分的供给能力的。因此,真正掌握核心技术,发展有竞争力、有辨识度、能满足客户需求的产品仍然是市场获胜的关键。

自主研发国产数据库引国家重点媒体关注。随着数据库市场持续升温,出现了很多基于开源的数据库,但市场规模是有限的,市场发展也有其必然规律,洗牌是不可避免。

数据存储是基于公开源代码还是自主研发并不重要,关键是要掌握数据存储的核心技术,而不是仅仅了解代码。在国际经济贸易上,这一点尤为重要。

2022年6月2日,《经济日报》9版推出了特别报道:“《数字引擎》激发强大动能”,全面阐述了自党的十八大以来,新一代信息技术产业作为科技创新的关键领域取得的显著成果。在多次突破关键技术领域板块中,达梦数据被多次提及。文章指出,“近十年来,达梦数据库在电网、电子政务、民航、金融等多个领域落地生根”,以此来代表那些能够持续引领关键技术创新的顶尖企业。

建立基于自主创新、安全可控的基础软硬件生态系统是发展网信产业的关键。作为构建信息世界和数字世界的基础工具,数据库是网信生态安全基础。

“没有化缘就没有核心技术,必须通过自主研发来解决问题。”达梦数据曾计划研发中国的数据库产品。在40多年的发展中,达梦数据始终坚持加强科技创新和自主研发的工作,将其放在优先位置,集中力量持续攻关,并在打破国外技术封锁、实现关键核心技术突破以及填补我国数据库高端技术领域空白方面取得了一系列重要成果。