数据库分表策略
1 垂直划分:
将数据表中的某些字段提出,组成新的数据表。“将群组id,专辑id,音乐id提出”,组成gzm数据表,而将“群组,专辑,音乐的详细信息单独放在其他数据表中”。在求取索引、关系时,操作数据库效率更高。
2 水平划分:
2.1物理上的水平切分:即将数据分配到不同的db服务器上。降低单点机器的负载。
2.2逻辑上的水平划分:将数据分到同一数据库的不同的数据表。多个数据表共同组成了一个完整的数据表,提高数据操作的效率。当一个有5000w行记录的数据表被拆分为10个表,假设每个表均匀的有500w行记录。10个表分表建索引的效率会提升。
2.21取余的方式:将数据均匀分到多个数据表中,数据表的个数固定,对于数据表的扩容困难。同时没有考虑不同机器的负载能力。注意相关度大的数据尽可能分到同一张表。“将同一个群组的所有音乐放到一张数据表中”,即以群组id来取余。
2.22 除的方式:取出数据表中的某个字段,除以某个数(数据表的容量),根据除数分表,利于扩容,但数据分配可能不均匀。“将用户id除以10000,为0则分到数据表0中,以此类推”。
2.23建立映射表的方式:不同规则映射不同数据表。在查询数据库时,先查映射表,再查具体的数据表,效率较低。
2.24按照时间分表:即按照一天、一周、一个月、一年等分表。查询时,数据跨越多张表时,会影响效率。
2.25将取余和除的方式结合:举例(当取余的方式,数据库容量满时,如何扩容)
摘自 gls_liujia的专栏