分库分表 – 滩之南

最近和朋友同事在一起聊天，问起我正在做的项目-数据访问中间件，很多人都有一丝疑惑，这不是重复造轮子的事情么？业界里ORM框架有mybatis/hiberate，分库分表有sharding-jdbc/mycat等等，你们为什么还要新做一个框架？新做的框架有什么不一样？

对于这些问题，我希望通过本文能够帮助解决这些疑惑。本文主要介绍了数据库访问的技术架构，然后讨论了分片在不同架构层级的技术实现方案，对标业界各个数据库访问中间件，相互进行比较，分析各种架构的实现差别和优缺点。

1. 什么是数据库分片

传统关系型数据库集中存储数据到单一节点，单表可以存储达数亿行的数据记录，通过主从备份作为灾备方案，保证数据的安全性，这基本可以覆盖大多数的应用场景。但是，随着互联网技术的发展，海量数据和高并发访问的应用场景日益增多，单表数据记录在突破一定阈值之后，其性能和可用性大幅下降。为了解决这个问题，将单一节点的数据拆分存储到多个数据库或表，即分库分表，使得关系型数据库能够存储的数据量阈值上限扩大1-2个数量级，从而满足业务需求。

数据库的分片拆分有两种方式，

按照业务划分的垂直拆分，将不同业务、不同模块的数据拆分为不同表。
按照容量平衡的水平拆分，将同一表的数据按照一定平衡策略，存储到不同数据库和表中。

标签：分库分表

Java数据库访问的分片技术架构实现

1. 什么是数据库分片