MySQL分表实现上百万上千万记录分布存储的批量查询设计模式

2016-02-19 18:05 83 1 收藏

岁数大了,QQ也不闪了,微信也不响了,电话也不来了,但是图老师依旧坚持为大家推荐最精彩的内容,下面为大家精心准备的MySQL分表实现上百万上千万记录分布存储的批量查询设计模式,希望大家看完后能赶快学习起来。

【 tulaoshi.com - 编程语言 】

  我们知道可以将一个海量记录的 MySQL 大表根据主键、时间字段,条件字段等分成若干个表甚至保存在若干服务器中。

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/bianchengyuyan/)

  唯一的问题就是跨服务器批量查询麻烦,只能通过应用程序来解决。谈谈在Java中的解决思路。其他语言原理类似。

  这里说的分表不是 MySQL 5.1 的 partition,而是人为把一个表分开存在若干表或不同的服务器。

  1. 应用程序级别实现

  见示意图

  SelectThreadManager 分表数据查询管理器

  它为分表的每个database or server 建立一个 thread pool

  addTask() - 添加任务

  stopTask() - 停止任务

  getResult() - 获取执行结果

  最快的执行时间 = 最慢的 MySQL 节点查询消耗时间

  最慢的执行时间 = 超时时间

  某个 ThreadPool 忙时候处理流程

  1. 假如 ThreadPoolN 非常忙,(也意味 DB N 非常忙);

  2. 新的查询任务到来,addTask(), 新的任务的一个thread加到ThreadPoolN任务排队中

  3. 外层应用已经获得其他 thread 返回结果,继续等待

  4. 外层应用等待超时的时间到,调用 stopTask() 设置该任务全部 thread 中的停止标志, 外层应用返回。

  5. 若干时间后,ThreadPoolN取到该排队 Thread, 因为设置了停止位,线程直接运行完成。

  2. JDBC 层实现

  做一个 JDBC Driver 的包装,拦截 PreparedStatement, Statement 的 executeQuery()

  然后调用 SelectThreadManager 完成

  3. MySQL partition

  MySQL 5.1 的 partition 功能由于单张表的数据跨文件,批量查询时候同样存在上述问题,不过它是在 MySQL 内部实现的,不需要外部调用者关心。其查询实现的原理应该大致类似。

  但 partition 只解决了 IO 的瓶颈,并不能解决 CPU 计算的瓶颈,因此无法代替传统的手工分表方式。

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/bianchengyuyan/)

来源:http://www.tulaoshi.com/n/20160219/1616779.html

延伸阅读
代码如下: drop table if exists dd; create table dd ( user_id int , class_no int , score int ); insert into dd values (1,1,1), (2,1,1), (3,1,2), (4,2,2); select class_no ,avg(score)from dd group by class_no order by avg(score); 在MySQL下面测试通过。
由于GROUP BY 实际上也同样会进行排序操作,而且与ORDER BY 相比,GROUP BY 主要只是多了排序之后的分组操作。当然,如果在分组的时候还使用了其他的一些聚合函数,那么还需要一些聚合函数的计算。所以,在GROUP BY 的实现过程中,与 ORDER BY 一样也可以利用到索引。 在MySQL 中,GROUP BY 的实现同样有多种(三种)方式,其中有两种方...
有个需求,一直没有解决,在google上找了半天,给出的方案没有一个能用了,最后鬼使神差搞定了。  是这样的,假设一个表: id   f_id    value    1     2         a    2  ...
标签: MySQL mysql数据库
以前在群里讨论过这个问题,比较的有意思.mysql的语法真好玩.他们原来都想用PHP的实现随机,但取出多条好像要进行两次以上查询.翻了手册,找到了下面这个语句,可以完成任务了。 SELECT * FROM table_name ORDER BY rand() LIMIT 5; rand在手册里是这么说的: RAND() ,RAND(N) :返回在范围0到1.0内的随机浮点值。如果一个整数参数N被指...
假设现在有如下N条记录 表明叫book id author title 1 aaa AAA 2 bbb BBB 3 ccc CCC 4 ddd DDD 5 eee AAA 现在想从这5条记录中查询所有title不重复的记录 select distinct title,author from book这样是不可以的 因为distinct只能作用于一个字段 想请教应该怎么写 答案: 代码如下: select a.* from book a right join ( select ma...

经验教程

233

收藏

6
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部