博客 - 七年演进：企查查如何用 TiDB 重塑亿级用户背后的“数据中枢”？

导语

在海量商业数据服务领域，数据架构的上限，往往就是业务增长的天花板。

对于企查查而言，这绝非一句空话。作为一家服务超 5 亿全球经营主体、注册用户破亿的商业信息查询平台，其业务本质是海量数据的高并发实时读写与复杂关联计算。每一次用户查询、每一份风险报告的毫秒级生成，都是对底层数据架构的一次极限施压。

企查查用七年时间，完成了一场从传统 MySQL 架构向云原生分布式数据库的战略跃迁，实现了关于业务连续性、数据价值挖掘与运营效率的深度变革。

业务之痛：当“单机架构”撑不起“亿级野心”

在业务爆发式增长的早期，企查查与许多互联网企业一样，依赖成熟的 MySQL 主从架构。然而，随着数据量级的指数级攀升，这种传统架构逐渐成为了业务扩展的“紧箍咒”。

业务连续性的隐患：单机存储面临物理上限，复杂的扩容流程和主备切换可能引发分钟级的业务中断。对于高度依赖实时数据的企查查而言，这意味着用户体验的受损和潜在的客户流失。
实时决策的滞后：在批处理、大表关联查询以及业务晚高峰等高负载场景下，数据库极易出现性能抖动，导致数据查询变慢，业务实时性大打折扣。
开发维护的重负：为了应对海量数据，不得不进行繁琐的分库分表，这不仅增加了开发复杂度，更让跨库查询和数据聚合成为技术团队的噩梦。

企查查意识到，要支撑未来十年的增长，必须寻找一个新的数据底座——既要能平滑承接现有的庞大业务，又要具备无限的弹性以应对未知的增长。

企查查引入TiDB ，不仅仅是替换了一个数据库，而是引入了一套“存算分离、弹性伸缩”的全新数据治理理念。

架构重塑：从“被动支撑”到“主动赋能”

企查查的 TiDB 演进之路，是一部不断让技术贴合业务需求的进化史。

兼容与弹性的双重红利：实现业务无感迁移

技术升级最大的阻碍往往是迁移成本。TiDB 极致的 MySQL 兼容性，让企查查的开发团队以极低的学习成本和近乎零的代码改造，就实现了业务的无缝切换。更重要的是，基于 Raft 协议的强一致性和在线弹性扩缩容能力，让企查查彻底告别了“分库分表”的痛苦，业务高峰期也能从容应对，保障了核心服务的高可用与连续性。

架构分层治理：用“确定性”资源保障核心 SLA

面对数百 TB 的海量数据，企查查基于业务属性，设计了精细化的多集群分层治理策略：

核心生产保障：部署两套独立的数据采集与清洗集群，作为数据流转的“心脏”，专职承载日均 1TB 的高吞吐写入与 ETL 处理，确保源头数据的实时入库。
高频查询支撑：建立元数据管理集群，将核心业务元数据集中管理，专门支撑高并发的用户检索请求，确保“查得快、查得准”。
复杂分析加速：设立报表生成集群，利用 TiFlash 列存引擎的分析能力，将原本分钟级的复杂报表查询压缩至秒级，为商业决策提供实时的洞察能力。

这种按业务域物理隔离的策略，有效避免了不同业务间的资源争抢，确保了不同等级业务的 SLA（服务等级协议） 得到刚性兑付。

降本增效：TiCDC 驱动的“极简主义”

技术先进性也要体现在成本账单上。在企查查的实践中，TiCDC 成为了降本增效的关键抓手。

在引入 TiCDC 之前，为了满足不同下游系统的数据需求，应用层往往需要进行复杂的“双写”开发，不仅代码维护成本高，还容易导致数据不一致。企查查通过 TiCDC 构建了一条实时数据高速通道：

架构简化：利用 TiCDC 将上千张核心表实时同步至下游的 RDS、Kafka 等系统，替代了臃肿的“应用层双写”架构。
成本骤降：这一改变直接释放了 30% 的开发人力，减少了对昂贵服务器资源的依赖，实现了 40% 的硬件资源节省。
实时性跃升：在支撑超过上千张表同步的压力下，典型表结构同步延迟 P99 稳定在 5 秒以内，确保了全链路数据的实时鲜活。

结语

从 MySQL 的瓶颈突围，到 All in TiDB 的坚定选择，企查查不仅解决了一次性的扩容难题，更构建了一套“弹性、分层、实时”的现代数据架构。这套架构让技术团队从繁重的运维泥潭中解放出来，专注于业务创新，以更低的成本、更高的效率，支撑起亿级用户在商业数据海洋中的每一次精准探索。