【TiDB 4.0 PCTA 学习笔记】-1.5 Important features of TiDB database platform(TiDB 技术特性)@2班+沈小瑜

课程名称:【TiDB 4.0 PCTA 学习笔记】-1.5 Important features of TiDB database platform(TiDB 技术特性)@2班+沈小瑜

学习时长:60min

课程收获:学习了TiDB 的核心特性以及生态工具

课程内容:

1、相关组件
 TiDB:无状态SQL引擎,承担计算业务,可以多实例启动。客户机可以连接到任何现有的tidb服务器实例。
 兼容MySQL协议,基于成本优化,在线DDL。
 TiKV:分布式存储引擎,副本之间的复制保障高可用。
 TiFlash:列存储引擎。
 PD:主管元数据的存储以及TiKV之间的数据调度。Placement Driver (简称 PD) 是整个集群的管理模块,其主要工作有三个: 一是存储集群的原信息(某个 Key 存储在哪个 TiKV 节点);二是对 TiKV 集群进行调度和负载均衡(如数据的迁移、Raft group leader 的迁移等);三是分配全局唯一且递增的事务 ID。PD 是一个集群,需要部署奇数个节点,一般线上推荐至少部署 3 个节点。
 TiSpark:TiSpark 是 PingCAP 为解决用户复杂 OLAP 需求而推出的产品。借助 Spark 平台,同时融合 TiKV 分布式集群的优势,和 TiDB 一起为用户一站式解决 HTAP (Hybrid Transactional/Analytical Processing)需求。 TiSpark 依赖于 TiKV 集群和 Placement Driver(PD)。
2、生态工具
 Backup & Restore (BR)
Backup & Restore (以下简称 BR )是 TiDB 分布式备份恢复的命令行工具,用于对 TiDB 集群进行数据备份和恢复。相比 dumpling 和 mydumper,BR 更适合大数据量的场景。
 Lightning
数据导入工具。
 Dumpling
数据导出工具。
 TiUP
安装部署工具.
 TiCDC
增量数据同步工具。
3、TiDB核心特性
 在线水平扩容/缩容
得益于 TiDB 存储计算分离的架构的设计,可按需对计算、存储分别进行在线扩容或者缩容,扩容或者缩容过程中对应用运维人员透明。
 金融级高可用
数据采用多副本存储,数据副本通过 Multi-Raft 协议同步事务日志,多数派写入成功事务才能提交,确保数据强一致性且少数副本发生故障时不影响数据的可用性。可按需配置副本地理位置、副本数量等策略满足不同容灾级别的要求。
 实时 HTAP
行列混存。提供行存储引擎 TiKV 、列存储引擎 TiFlash 两款存储引擎, TiFlash 通过 Multi-Raft Learner 协议实时从 TiKV 复制数据,确保行存储引擎 TiKV 和列存储引擎 TiFlash 之间的数据强一致。 TiKV 、 TiFlash 可按需部署在不同的机器,解决 HTAP 资源隔离的问题。
 云原生的分布式数据库
专为云而设计的分布式数据库,通过 TiDB Operator 可在公有云、私有云、混合云中实现部署工具化、自动化。
 兼容 MySQL 5.7 协议和 MySQL 生态
兼容 MySQL 5.7 协议、 MySQL 常用的功能、 MySQL 生态,应用无需或者修改少量代码即可从 MySQL 迁移到
TiDB 。提供丰富的数据迁移工具帮助应用便捷完成数据迁移。
4、TiKV/TiFlash(Storage layer)
 TiKV:行式存储,适合事务处理。
 TiFlash:列式存储,适合应用分析。
 TiKV和TiFlash通过raft协议同步,实现强一致性。

学习过程中参考的其他资料