课程名称:1.1 A Brief History of Distributed Database
学习时长:
5 mins
课程收获:
了解数据库发展历史
课程内容:
分布式数据库历史:
-
什么是分布式数据库
分布式数据库是一种逻辑上集中,物理上分布的大型数据库(即分布在多台计算机中,每台计算机有自己局部的数据库,多台计算机由网络连接,组成一个完整的、在逻辑上集中的数据库); -
发展历史
90年代:基于sql的OLTP数据库,共享磁盘、CPU和网络;
2000年:a.数据库中间件,在数据库和业务中间实现分库分表,解决大规模数据存储的需求;缺点:只能编程语言实现,不支持sql交互;b.OLAP的出现,基于sql,主要是已分布式的形式出现,处理海量数据,主要按列存储;c.Nosql,使用Key-Value Api和数据交互,特性:高可用,可拓展,非关系型,不支持事务;
2010年:NewSql,即HTAP数据库(混合事务分析处理),同时满足OLTP、OLAP相关特性,是一种高性能、高可用、可扩展的sql数据库
SQL、NoSQL、NewSQL:
-
SQL
关系型数据库。主要代表:SQL Server、Oracle、MySQL、PostgreSQL。 -
NoSQL
非关系型数据库,不保证关系型数据的ACID(ACID是Atomic(原子性)、Consistency(一致性)、Isolation(隔离性)和Durability(持久性)的英文缩写)特性。主要代表:MongoDB、Redis、CouchDB。 -
NewSQL
NewSQL选择汲取了SQL和NewSQL的优点,希望将ACID和可扩展性以及高性能结合。主要代表:Clustrix、GenieDB、TiDB
OLTP、OLAP、HTAP:
- OLTP
联机事务过程,以小的事务和小的查询为主; - OLAP
联机分析处理过程,着重于处理海量数据分析的需求,即数据仓库,使用sql进行交互,分布式; - HTAP
混合事务分析处理过程,既能满足OLTP联机事务处理,又能满足OLAP联机分析处理"