热门课程

免费试听

上课方式

开班时间

当前位置: 首页 -   文章 -   新闻动态 -   正文

数据库技术发展趋势

知了堂姐
2024-07-08 17:22:16
0

大数据时代,数据量不断爆炸式增长,数据存储结构也越来越灵 活多样,日益变革的新兴业务需求催生数据库及应用系统的存在形式 愈发丰富,这些变化均对数据库的各类能力不断提出挑战,推动数据库技术的不断演进,总结起来体现为三个方向:

1)多模数据库实现

一库多用、利用统一框架支撑混合负载处理、运用 AI 实现管理自治, 提升易用性、降低使用成本;

2)充分利用新

兴硬件、与云基础设施深度结合,增强功能、提升性能;

3)利用隐私计算技术助力安全能力提升、区块链数据库辅助数

据存证溯源,提升数据可信与安全。

1.趋势一:多模数据库实现一库多用

后关系型阶段,数据结构越来越灵活多样,如表格类型的关系数 据、半结构化的用户画像数据以及非结构化的图片和视频数据等。面 对这些多种结构的数据,应用程序对不同数据提出了不同存储要求, 数据的多样性成为数据库平台面临的一大挑战,数据库因此需要适应 多类型数据管理的需求。多模数据库支持灵活的数据存储类型,将各 种类型的数据进行集中存储、查询和处理,可以同时满足应用程序对 于结构化、半结构化和非结构化数据的统一管理需求。目前行业以 Azure Cosmos DB、ArangoDB、SequoiaDB 和 Lindorm 等多模数据 库为典型代表。未来在云化架构下,多类型数据管理是一种新趋势, 也是简化运维、节省开发成本的一个新选择。

2.趋势二:统一框架支撑分析与事务混合处理

业务系统的数据处理分为联机事务处理(OLTP)与联机分析处 理(OLAP)两类。企业通常维护不同数据库以便支持两类不同的任 务,管理和维护成本高。因此,能够统一支持 OLTP 和 OLAP 的数据 库成为众多企业的需求。产业界当先正基于创新的计算存储框架研发

HTAP 数据库,其能够基于统一套引擎同时支撑业务系统运行和分析 决策场景,避免在传统架构中,在线与离线数据库之间大量的数据交 互。目前 HTAP 大致有两种实现方式,第一种是主备库物理隔离,主 库运行 OLTP 负载,备库运行 OLAP 负载,主备之间通过重做日志进 行数据同步。第二种是采用一体化设计,通过同一套引擎实现混合负 载,区分 OLTP 与 OLAP 请求所在资源组,对资源组进行逻辑隔离, 例如 Oracle 多租户隔离机制。HTAP 典型产品有 Oracle、SQL Server、 Greenplum、TiDB、OceanBase 和 PolarDB 等。需要注意的是,HTAP 的价值在于更加简单通用,对于绝大部分中等规模的客户,数据量不 会特别大,只需要一套系统即可,但对于超大型互联网企业,HTAP 数据库的分析性能可能不如专用 OLAP 数据库或大数据平台。

3.趋势三:运用 AI 实现管理自治

面对大规模数据和不同的应用场景,传统数据库组件存在业务类 型不敏感、查询优化能力弱等问题。目前有研究通过将传统数据库组 件用机器学习算法替代,来实现更高的查询和存储效率,自动化处理 各种任务,例如自动管理计算与存储资源、自动防范恶意访问与攻击、 主动实现数据库智能调优。机器学习算法可以分析大量数据记录,标 记异常值和异常模式,帮助企业提高安全性,防范入侵者破坏,还可 以在系统运行时自动、连续、无人工干预地执行修补、调优、备份和 升级操作,尽可能减少人为错误或恶意行为,确保数据库高效运行、 安全无失。2019 年 6 月,Oracle 推出云上自治数据库 Autonomous Database;2020 年 4 月,阿里云发布“自动驾驶”级数据库平台 DAS;2021 年 3 月,华为发布了融入 AI 框架的 openGauss2.0 版本。其均采

用上述思想降低数据库集群的运维管理成本,保障数据库持续稳定、 高效运行。未来 80%以上的日常运维工作有望借助 AI 完成。

4.趋势四:充分利用新兴硬件

最近十几年,新兴硬件在经历学术研究、工程化和产品化阶段发 展,对数据库系统设计提供了广阔思路。期间最主要的硬件技术进步 是多处理器(SMP)、多核(MultiCore)、大内存(Big Memory)和 固态硬盘(SSD),多处理器和多核为并行处理提供可能,SSD 大幅 提升了数据库系统的 IOPS 和降低延迟,大内存促进了内存数据库引 擎的发展。根据第三方机构 Wikibon 预测,2026 年 SSD 单 TB 成本 将低于机械硬盘,达到 15 美元/TB;非易失性内存(NVM)具有容 量大、低延迟、字节寻址、持久化等特性,能够应用于传统数据库存 储引擎各个部分,如索引、事物并发控制、日志、垃圾回收等方面; GPU 适用于特定数据库操作加速,如扫描、谓词过滤、大量数据的 排序、大表关联、聚集等操作,互联网公司在 FPGA 加速进行了很多 探索,例如微软利用 FPGA 加速网卡处理,百度用 FPGA 加速查询处 理等。随着新型硬件成本逐渐降低,充分利用新兴硬件资源提升数据 库性能、降低成本,是未来数据库发展的重要方向之一。

5.趋势五:与云基础设施深度结合

Gartner 预测到 2022 年 75%的数据库将托管在云端。云计算技术 的不断发展催生出将数据库部署在云上的需求,通过云服务形式提供 数据库功能的云数据库应运而生。云与数据库的融合,减少了数据库参数的重复配置,具有快速部署、高扩展性、高可用性、可迁移性、 易运维性和资源隔离等特点,具体有两种形态,一种是基于云资源部 署的传统数据库;另一种是基于容器化、微服务、Serverless 等理念 设计的存算分离架构的云原生数据库。云原生数据库能够随时随地从 多前端访问,提供云服务的计算节点,并且能够灵活及时调动资源进 行扩缩容,助力企业降本增效。以亚马逊 AWS、阿里云、Snowflake 等为代表的企业,开创了云原生数据库时代。未来,数据库将深度结 合云原生与分布式特点,帮助用户实现最大限度资源池化、弹性变配、 超高并发等能力,更加便捷、低成本实现云上数字化转型与升级。

6.趋势六:隐私计算技术助力安全能力提升

随着数据上云趋势显著,云数据库面临的风险相较于传统数据库 更加多样化、复杂化。如何解决第三方可信问题是云数据库面临的首 要安全挑战。当前云数据库数据安全隐私保护是针对数据所处阶段来 制定保护措施的,如在数据传输阶段使用安全传输协议 SSL/TLS,在 数据持久化存储阶段使用透明存储加密,在返回结果阶段使用数据脱 敏策略等。这些传统技术手段可以解决单点风险,但不成体系,且对 处于运行或者运维状态下的数据则缺少有效的保护。近年来以同态加 密等密码学为代表的软件解决方案和以可信执行环境(TEE)为代表 的硬件方案为数据库安全设计提供许多新思路。密码学方案的核心思 路是整个运算过程都是在密文状态,通过基于数学理论的算法来直接 对密文数据进行检索与计算。硬件方案的核心思路是将存放于普通环 境(REE)的加密数据传递给 TEE 侧,并在 TEE 侧完成数据解密和计算任务。基于隐私计算技术的数据库产品有 CryptDB、ZeroDB、 openGauss 等。未来,此类数据库将围绕算法安全性和性能损耗等问 题,逐步突破,进而提供覆盖数据全生命周期的安全保护机制。

7.趋势七:区块链数据库辅助数据存证溯源

数据库管理员或黑客对数据库历史记录的修改是一个经常爆发 的问题。区块链具有去中心化、信息不可篡改等特征,区块链数据库 能够长期留存有效记录,数据库的所有历史操作均不可更改并能追溯, 适用于金融机构、公安等行业的应用场景。区块链数据库典型产品有 BlockchainDB、BigchainDB 和 ChainSQL 等。区块链数据库由于要容 忍节点拜占庭行为而不得不采用代价更高的 PBFT、PoW 等共识算法 成为落地应用的一大挑战,此外,由于没有统一的协调者,如何保证 区块链网络分片时分布式系统的安全性,高并发下的并行控制如何保 证 ACID 也都是设计者不可忽视的问题。未来,提升区块链数据库性 能将成为学术界与工业界共同探索的命题。

大家都在看

知了堂2023届“天府人才·校招行”启动ing,...

2024-07-08 浏览次数:0

知了汇智联合四川文理学院举办 “行业分析及就业指...

2024-07-08 浏览次数:0

网络安全好找工作吗?网络安全缺口大吗?

2024-07-08 浏览次数:0

Java自学还是培训好?来看看自学和培训的效果区...

2024-07-08 浏览次数:0

如何判断Java培训机构是否可靠

2024-07-08 浏览次数:0

一个完整的web框架是什么?常用的web开发框架

2024-07-08 浏览次数:0
最新资讯