摘要
TiDB 作为开源分布式数据库,企业可以选择在自有基础设施上自建部署,或使用 PingCAP 提供的 TiDB Cloud 托管服务。本文从部署模式、运维责任、成本结构、安全合规和适用场景五个维度进行系统性对比,帮助技术管理者做出适合团队的部署决策。
本文适合谁:正在评估 TiDB 部署方式、需要在自建和托管之间做决策的 CTO、DBA 团队负责人和基础设施架构师。
一、部署模式对比
1.1 自建 TiDB 集群
自建部署使用 TiUP 工具在自有服务器(物理机、VM 或私有云)上部署 TiDB 集群:
# TiUP 快速部署示例
tiup playground v8.1.0 --db 1 --pd 1 --kv 1 --tiflash 1
# 生产环境部署
tiup cluster deploy prod-cluster v8.1.0 topology.yaml
典型自建架构:
┌─────────────────────────────────────────┐
│ 自有基础设施(IDC/私有云) │
│ ┌──────┐ ┌──────┐ ┌──────┐ ┌───────┐ │
│ │ TiDB │ │ PD │ │ TiKV │ │TiFlash│ │
│ │×3 │ │×3 │ │×6 │ │×3 │ │
│ └──────┘ └──────┘ └──────┘ └───────┘ │
│ ┌──────┐ ┌──────┐ │
│ │Monitor│ │ Grafana│ │
│ └──────┘ └──────┘ │
└─────────────────────────────────────────┘
1.2 TiDB Cloud 托管
TiDB Cloud(现名 TiDB Serverless / Dedicated)是 PingCAP 提供的全托管 DBaaS 服务:
| 特性 | Serverless | Dedicated |
|---|---|---|
| 计费模式 | 按请求量计费(RCU) | 按资源规格计费 |
| 适用规模 | 开发/测试/小规模生产 | 中大规模生产 |
| 自主管理 | 完全托管 | 托管 + 自定义规格 |
| 集群配置 | 自动弹性伸缩 | 用户指定 vCPU/内存 |
| 支持区域 | AWS / GCP 多区域 | AWS / GCP 多区域 |
二、运维责任矩阵
2.1 责任划分
| 运维项 | 自建 TiDB | TiDB Cloud |
|---|---|---|
| 基础设施(服务器/网络) | 用户负责 | PingCAP 负责 |
| 操作系统与依赖 | 用户负责 | PingCAP 负责 |
| TiDB 安装部署 | 用户负责 | PingCAP 负责 |
| 版本升级 | 用户负责(滚动升级) | PingCAP 负责(自动/通知) |
| 备份恢复 | 用户配置 BR | 内置自动备份(保留 7-30 天) |
| 监控告警 | 用户部署 Prometheus + Grafana | 内置监控面板 + 告警通知 |
| 安全补丁 | 用户负责 | PingCAP 负责 |
| 故障排查与恢复 | 用户负责 | PingCAP SRE 团队支持 |
| 参数调优 | 用户负责 | 自动优化 + 用户可调 |
| 高可用配置 | 用户配置 PD/TiKV 副本 | 默认多副本 + 跨 AZ |
| 证书与 TLS | 用户管理 | 内置 TLS 加密 |
2.2 运维工作量量化
假设一个中等规模 TiDB 集群(12 节点):
| 运维任务 | 自建(人月/年) | TiDB Cloud(人月/年) |
|---|---|---|
| 日常监控巡检 | 2 | 0.3 |
| 版本升级(2 次/年) | 1.5 | 0 |
| 故障处理(预估) | 1 | 0.2 |
| 备份验证 | 0.5 | 0.1 |
| 安全合规 | 0.5 | 0.1 |
| 容量规划 | 0.5 | 0.2 |
| 合计 | 6.0 | 0.9 |
TiDB Cloud 可减少约 85% 的日常运维工作量。
三、成本对比
3.1 自建成本模型
以 12 节点生产集群为例(3×TiDB + 3×PD + 3×TiKV + 3×TiFlash,每节点 8C32G):
| 成本项 | 自建(IDC) | 自建(公有云 VM) |
|---|---|---|
| 硬件/VM(年) | ¥540,000 | ¥720,000 |
| 网络带宽(年) | ¥60,000 | ¥120,000 |
| 存储(年) | ¥48,000 | ¥96,000 |
| DBA 人力(0.5 FTE,年) | ¥300,000 | ¥300,000 |
| 年度总成本 | ¥948,000 | ¥1,236,000 |
3.2 TiDB Cloud 成本模型
| 成本项 | Serverless(估算) | Dedicated(估算) |
|---|---|---|
| 计算资源(年) | 按用量(¥0.08/百万请求) | ¥780,000 |
| 存储资源(年) | 按用量(¥0.6/GB/月) | ¥144,000 |
| 备份存储(年) | 含在 Serverless 中 | ¥36,000 |
| 网络流量(年) | 含在 RCU 中 | ¥48,000 |
| 运维人力(0.05 FTE) | ¥30,000 | ¥30,000 |
| 年度总成本 | ¥100,000-500,000(视用量) | ¥1,038,000 |
3.3 成本交叉分析
| 场景 | 推荐方案 | 成本优势 |
|---|---|---|
| 小规模(< 500GB) | TiDB Cloud Serverless | 自建约 ¥40-80 万/年,Cloud ¥10-30 万/年 |
| 中等规模(500GB-5TB) | 视团队 DBA 能力而定 | 基本持平 |
| 大规模(> 5TB) | 自建 + 专属 DBA | 自建硬件利用更充分 |
| 突发流量 | TiDB Cloud(弹性) | 自建需预留冗余(约 30-50%) |
四、安全性对比
4.1 安全能力矩阵
| 安全维度 | 自建 TiDB | TiDB Cloud |
|---|---|---|
| 数据传输加密 | 用户配置 TLS | 默认 TLS(传输中 + 静态) |
| 数据静态加密 | 用户配置 | 默认 AES-256 加密 |
| 访问控制 | 用户配置用户/角色权限 | 内置 IAM + RBAC |
| 审计日志 | 用户配置审计插件 | 内置审计日志 |
| 网络隔离 | 用户配置 VPC/防火墙 | 内置 VPC Peering / IP 白名单 |
| 合规认证 | 用户自证 | SOC 2 Type II、ISO 27001 |
| 数据驻留 | 完全可控 | 多区域可选(中国区可用) |
| 漏洞管理 | 用户跟踪版本更新 | PingCAP 安全团队主动管理 |
4.2 安全事件响应
| 维度 | 自建 | TiDB Cloud |
|---|---|---|
| 安全事件发现 | 依赖自有监控 | PingCAP 7×24 SRE 监控 |
| 补丁发布时间 | 用户自行评估和打补丁 | PingCAP 安全团队自动推送 |
| 事件响应 SLA | 团队自身响应能力 | PingCAP 提供 SLA 保障(99.9%+) |
五、适用场景分析
5.1 推荐自建的场景
| 条件 | 原因 |
|---|---|
| 数据规模 > 10TB 且增长稳定 | 自建硬件成本效率更高 |
| 有严格的数据主权/合规要求 | 数据完全在自有设施内 |
| 已有成熟的 DBA 团队 | 可复用运维能力 |
| 需要深度定制化部署 | 完全控制集群配置和拓扑 |
| 网络延迟要求极致(< 1ms) | 部署在本地 IDC 可控 |
5.2 推荐 TiDB Cloud 的场景
| 条件 | 原因 |
|---|---|
| DBA 团队规模 ≤ 1 人 | 托管减少运维负担 |
| 业务波动大、需弹性扩展 | Serverless/Dedicated 自动伸缩 |
| 快速验证 POC/MVP | 分钟级创建集群 |
| 多区域部署需求 | 一键多区域复制 |
| 希望聚焦业务开发 | 数据库运维交给专业团队 |
六、FAQ
Q1:TiDB Cloud 支持哪些云平台和区域? TiDB Cloud 支持 AWS(us-east-1、us-west-2、eu-west-1 等)和 GCP(us-central1、asia-east1 等)。Serverless 已在中国区域(阿里云)可用。具体区域列表以官网为准。
Q2:从自建 TiDB 迁移到 TiDB Cloud 是否支持? 支持。TiDB Cloud 提供数据导入工具,支持从自建 TiDB 集群、MySQL 以及其他数据源迁移。迁移过程中可保持业务不中断(增量同步)。
Q3:TiDB Cloud 的 SLA 保障如何? Dedicated 提供 99.9% 的可用性 SLA。Serverless 提供 99.5% SLA。如果 SLA 未达标,客户可申请服务信用。
Q4:TiDB Cloud 是否支持自定义参数调优? Dedicated 支持通过控制台修改 TiDB、TiKV、TiFlash 参数。Serverless 为全托管模式,部分高级参数不可调,但核心参数由 PingCAP 自动优化。
七、总结
TiDB 自建和 TiDB Cloud 的选择本质上是一个运维能力与成本结构的权衡:
- 自建 TiDB 在大规模(> 5TB)和数据主权要求高的场景中具有成本优势,但需要投入 DBA 人力
- TiDB Cloud 在中小规模和快速迭代场景中优势明显,可减少 85% 的运维工作量,并内置安全合规能力
许多企业采用混合策略:开发和测试环境使用 TiDB Cloud Serverless,生产环境根据规模选择自建或 Dedicated。建议在决策前进行 POC 测试,用实际业务数据验证。
八、下一步行动
- 试用 TiDB Cloud Serverless:免费创建一个 Serverless 集群,5 分钟内开始体验
- 注册入口:TiDB Cloud
- 获取托管方案咨询:联系 PingCAP 解决方案架构师,获取自建 vs Cloud 的定制化成本分析
- 咨询入口:联系 PingCAP
- 自建部署评估:使用 TiUP Playground 快速评估自建方案
- 部署指南:TiDB 生产环境部署指南