`

mysql分页慢解决方法

 
阅读更多
http://laiguowei2004.blog.163.com/blog/static/36829000201162765456254/
http://www.111cn.net/database/mysql/50921.htm


来源:http://www.chhua.com/web-note912

       MySql 性能到底能有多高?用了php半年多,真正如此深入的去思考这个问题还是从前天开始。有过痛苦有过绝望,到现在充满信心!MySql 这个数据库绝对是适合dba级的高手去玩的,一般做一点1万篇新闻的小型系统怎么写都可以,用xx框架可以实现快速开发。可是数据量到了10万,百万至千万,他的性能还能那么高吗?一点小小的失误,可能造成整个系统的改写,甚至更本系统无法正常运行!好了,不那么多废话了。用事实说话,看例子:

       数据表 collect ( id, title ,info ,vtype) 就这4个字段,其中 title 用定长,info 用text, id 是逐渐,vtype是tinyint,vtype是索引。这是一个基本的新闻系统的简单模型。现在往里面填充数据,填充10万篇新闻。

       最后collect 为 10万条记录,数据库表占用硬盘1.6G。OK ,看下面这条sql语句:

       select id,title from collect limit 1000,10; 很快;基本上0.01秒就OK,再看下面的

       select id,title from collect limit 90000,10; 从9万条开始分页,结果?

       8-9秒完成,my god 哪出问题了????其实要优化这条数据,网上找得到答案。看下面一条语句:

       select id from collect order by id limit 90000,10; 很快,0.04秒就OK。 为什么?因为用了id主键做索引当然快。网上的改法是:

       select id,title from collect where id>=(select id from collect order by id limit 90000,1) limit 10;

       这就是用了id做索引的结果。可是问题复杂那么一点点,就完了。看下面的语句:

       select id from collect where vtype=1 order by id limit 90000,10; 很慢,用了8-9秒!

       到了这里我相信很多人会和我一样,有崩溃感觉!vtype 做了索引了啊?怎么会慢呢?vtype做了索引是不错,你直接 select id from collect where vtype=1 limit 1000,10; 是很快的,基本上0.05秒,可是提高90倍,从9万开始,那就是0.05*90=4.5秒的速度了。和测试结果8-9秒到了一个数量级。从这里开始有人提出了分表的思路,这个和discuz 论坛是一样的思路。思路如下:

       建一个索引表: t (id,title,vtype) 并设置成定长,然后做分页,分页出结果再到 collect 里面去找info 。 是否可行呢?实验下就知道了。

       10万条记录到 t(id,title,vtype) 里,数据表大小20M左右。用
       select id from t where vtype=1 order by id limit 90000,10; 很快了。基本上0.1-0.2秒可以跑完。为什么会这样呢?我猜想是因为collect 数据太多,所以分页要跑很长的路。limit 完全和数据表的大小有关的。其实这样做还是全表扫描,只是因为数据量小,只有10万才快。OK, 来个疯狂的实验,加到100万条,测试性能。

       加了10倍的数据,马上t表就到了200多M,而且是定长。还是刚才的查询语句,时间是0.1-0.2秒完成!分表性能没问题?错!因为我们的limit还是9万,所以快。给个大的,90万开始

       select id from t where vtype=1 order by id limit 900000,10; 看看结果,时间是1-2秒!

       why ?? 分表了时间还是这么长,非常之郁闷!有人说定长会提高limit的性能,开始我也以为,因为一条记录的长度是固定的,mysql 应该可以算出90万的位置才对啊? 可是我们高估了mysql 的智能,他不是商务数据库,事实证明定长和非定长对limit影响不大? 怪不得有人说 discuz到了100万条记录就会很慢,我相信这是真的,这个和数据库设计有关!

       难道MySQL 无法突破100万的限制吗???到了100万的分页就真的到了极限???

       答案是: NO !!!! 为什么突破不了100万是因为不会设计mysql造成的。下面介绍非分表法,来个疯狂的测试!一张表搞定100万记录,并且10G 数据库,如何快速分页!

       好了,我们的测试又回到 collect表,开始测试结论是: 30万数据,用分表法可行,超过30万他的速度会慢道你无法忍受!当然如果用分表+我这种方法,那是绝对完美的。但是用了我这种方法后,不用分表也可以完美解决!

       答案就是:复合索引! 有一次设计mysql索引的时候,无意中发现索引名字可以任取,可以选择几个字段进来,这有什么用呢?开始的select id from collect order by id limit 90000,10; 这么快就是因为走了索引,可是如果加了where 就不走索引了。抱着试试看的想法加了 search(vtype,id) 这样的索引。然后测试

       select id from collect where vtype=1 limit 90000,10; 非常快!0.04秒完成!

       再测试: select id ,title from collect where vtype=1 limit 90000,10; 非常遗憾,8-9秒,没走search索引!

       再测试:search(id,vtype),还是select id 这个语句,也非常遗憾,0.5秒。

       综上:如果对于有where 条件,又想走索引用limit的,必须设计一个索引,将where 放第一位,limit用到的主键放第2位,而且只能select 主键!

       完美解决了分页问题了。可以快速返回id就有希望优化limit , 按这样的逻辑,百万级的limit 应该在0.0x秒就可以分完。看来mysql 语句的优化和索引时非常重要的!

       好了,回到原题,如何将上面的研究成功快速应用于开发呢?如果用复合查询,我的轻量级框架就没的用了。分页字符串还得自己写,那多麻烦?这里再看一个例子,思路就出来了:

       select * from collect where id in (9000,12,50,7000); 竟然 0秒就可以查完!

       mygod ,mysql 的索引竟然对于in语句同样有效!看来网上说in无法用索引是错误的!

       有了这个结论,就可以很简单的应用于轻量级框架了:

       代码如下:

       $db = dblink();
       $db->pagesize = 20;

       $sql = ”select id from collect where vtype=$vtype”;

       $db->execute($sql);
       $strpage = $db->strpage(); //将分页字符串保存在临时变量,方便输出
       while($rs=$db->fetch_array()){
              $strid.=$rs['id'].’,';
       }
       $strid=substr($strid,0,strlen($strid)-1); //构造出id字符串
       $db->pagesize=0; //很关键,在不注销类的情况下,将分页清空,这样只需要用一次数据库连接,不需要再开;
       $db->execute(“select id,title,url,sTime,gTime,vtype,tag from collect where id in ($strid)”);

       <?php while($rs=$db->fetch_array()): ?>
       <tr>
              <td>&nbsp;<?php echo $rs['id'];?></td>
              <td>&nbsp;<?php echo $rs['url'];?></td>
              <td>&nbsp;<?php echo $rs['sTime'];?></td>
              <td>&nbsp;<?php echo $rs['gTime'];?></td>
              <td>&nbsp;<?php echo $rs['vtype'];?></td>
              <td>&nbsp;<a href=”?act=show&id=<?php echo $rs['id'];?>” target=”_blank”><?php echo $rs['title'];?></a></td>
              <td>&nbsp;<?php echo $rs['tag'];?></td>
       </tr>
       <?php endwhile; ?>
       </table>
       <?php
       echo $strpage;

       通过简单的变换,其实思路很简单:1)通过优化索引,找出id,并拼成 “123,90000,12000″ 这样的字符串。2)第2次查询找出结果。

       小小的索引+一点点的改动就使mysql 可以支持百万甚至千万级的高效分页!

       通过这里的例子,我反思了一点:对于大型系统,PHP千万不能用框架,尤其是那种连sql语句都看不到的框架!因为开始对于我的轻量级框架都差点崩溃!只适合小型应用的快速开发,对于ERP,OA,大型网站,数据层包括逻辑层的东西都不能用框架。如果程序员失去了对sql语句的把控,那项目的风险将会成几何级数增加!尤其是用mysql 的时候,mysql 一定需要专业的dba 才可以发挥他的最佳性能。一个索引所造成的性能差别可能是上千倍!

       PS: 经过实际测试,到了100万的数据,160万数据,15G表,190M索引,就算走索引,limit都得0.49秒。所以分页最好别让别人看到10万条以后的数据,要不然会很慢!就算用索引。经过这样的优化,mysql到了百万级分页是个极限!但有这样的成绩已经很不错,如果你是用sqlserver肯定卡死!而160万的数据用 id in (str) 很快,基本还是0秒。如果这样,千万级的数据,mysql应该也很容易应付。
分享到:
评论

相关推荐

    如何优化Mysql千万级快速分页

    如何优化Mysql千万级快速分页,详尽解决方案!

    MYSQL分页limit速度太慢的优化方法

     如 * from table limit 0,10 这个没有问题 当 limit 200000,10 的时候数据读取就很慢,可以按照一下方法解决  第一页会很快  PERCONA PERFORMANCE CONFERENCE 2009上,来自雅虎的几位工程师带来了一篇”...

    MySQL limit使用方法以及超大分页问题解决

    日常开发中,我们使用mysql来实现分页功能的时候,总是会用到mysql的limit语法.而怎么使用却很有讲究的,今天来总结一下. limit语法 limit语法支持两个参数,offset和limit,前者表示偏移量,后者表示取前limit条数据. ...

    MySQL高效分页解决方案集分享

    一,最常见MYSQL最基本的分页方式: 代码如下:select * from content order by id desc limit 0, 10在中小数据量的情况下,这样的SQL足够用了,唯一需要注意的问题就是确保使用了索引。随着数据量的增加,页数会...

    浅谈MySQL分页Limit的性能问题

    MySQL的分页查询通常通过limit来实现。limit接收1或2个整数型参数,如果是2个参数,第一个是指定第一个返回记录行的偏移量,第二个是返回记录行的最大数目。初始记录行的偏移量是0。为了与PostgreSQL兼容,limit也...

    深入浅出Mysql优化性能提升.txt

    15-大数据量分页优化.wmv 16-索引与排序.wmv 17-冗余索引与重复索引.wmv 18-索引碎片修复.wmv 19-Explain分析SQL效果.wmv 20-In型子查询陷阱.wmv 21-Exists一定比子查询慢吗.wmv 22-Max Min非常规优化技巧.wmv 23-...

    MySQL Like模糊查询速度太慢如何解决

    问题:明明建立了索引,为何Like模糊查询速度还是特别慢? Like是否使用索引?  1、like %keyword 索引失效,使用全表扫描。但可以通过翻转函数+like前模糊查询+建立翻转函数索引=走翻转函数索引,不走全表扫描。 ...

    MySql实现翻页查询功能

    首先明确为什么要使用分页查询,因为数据庞大,查询不可能全部显示在页面上,如果全部显示在页面上,也会造成查询速度慢的情况,所以分页查询解决了①数据查询;②性能优化,等(其他问题欢迎补充)的问题。 分页...

    MySQL中常见的八种SQL错误用法示例

    但也存在部分客户在使用MySQL数据库的过程中遇到一些比如响应时间慢,CPU打满等情况。 阿里云RDS专家服务团队帮助云上客户解决过很多紧急问题。现将《ApsaraDB专家诊断报告》中出现的部分常见SQL问题总结如下,供...

    AspNetPager.dll

    因为AspNetPager控件和数据是独立的,因此要分页的数据可以来自任何数据源,如SQL Server、Oracle、Access、mysql、DB2等数据库以及XML文件、内存数据或缓存中的数据、文件系统等等。 AspNetPager 7.1 版发布(2008...

    J2EE三大框架_笔记_a

    3-JSP+DAO和MVC+DAO(基于MySQL数据库分页)-v笔记 4-Struts入门笔记 005_Struts+DAO登陆 6-Struts标签-BEAN标签笔记 7-Struts标签 -LOGIC标签笔记 8-Struts标签- HTML标签笔记 9-Struts高级部分(1)(解决重复提交、...

    J2EE框架_笔记_b

    3-JSP+DAO和MVC+DAO(基于MySQL数据库分页)-v笔记 4-Struts入门笔记 005_Struts+DAO登陆 6-Struts标签-BEAN标签笔记 7-Struts标签 -LOGIC标签笔记 8-Struts标签- HTML标签笔记 9-Struts高级部分(1)(解决重复提交、...

    J2EE框架_笔记_c

    3-JSP+DAO和MVC+DAO(基于MySQL数据库分页)-v笔记 4-Struts入门笔记 005_Struts+DAO登陆 6-Struts标签-BEAN标签笔记 7-Struts标签 -LOGIC标签笔记 8-Struts标签- HTML标签笔记 9-Struts高级部分(1)(解决重复提交、...

    Java面试宝典2020修订版V1.0.1.doc

    34、mysql分页 52 35、MySQL、SqlServer、oracle写出字符存储、字符串转时间 52 36、update语句可以修改结果集中的数据吗? 53 37、oracle如何设置主键自动增长? 53 38、表连接、子查询的区别是什么?它们可以相互...

    Java常见面试题208道.docx

    155.什么情况会导致 kafka 运行变慢? 156.使用 kafka 集群需要注意什么? 十六、Zookeeper 157.zookeeper 是什么? 158.zookeeper 都有哪些功能? 159.zookeeper 有几种部署模式? 160.zookeeper 怎么保证主从节点...

    java面试题,180多页,绝对良心制作,欢迎点评,涵盖各种知识点,排版优美,阅读舒心

    【消息队列】持久化消息非常慢 162 【消息队列】消息的不均匀消费 162 【消息队列】ActiveMQ中的消息重发时间间隔和重发次数吗? 164 【Dubbo】dubbo介绍 166 Dubbo 是什么 166 Dubbo 架构流程图 167 调用流程 167 ...

    曼波整站系统5.2.0

    使在mysql5.0.xx 环境正常安装使用 1) 解决索引过长问题,把4个 acl 表的字段 section_value 和 value 统一为 varchar(100),字段 name 统一为 varchar(255) 2) 优化表,清除没用的或重复的索引 3) 改进...

    最新Java面试题视频网盘,Java面试题84集、java面试专属及面试必问课程

    │ Java面试题28.mysql和oracle的分页语句(着重说思路).mp4 │ Java面试题29.触发器的使用场景.mp4 │ Java面试题30.存储过程的优点.mp4 │ Java面试题31.jdbc调用存储过程.mp4 │ Java面试题32.简单说一下你对...

    hope::artist_palette: Java 学习笔记

    温馨提示: 仓库.git文件太大,push太慢,一个老套的解决方案:(这样将克隆只有一个提交历史记录的存储库。因此,您的.git文件夹将更轻) git clone --depth 1 https://github.com/java-aodeng/hope.git目录面试题+...

Global site tag (gtag.js) - Google Analytics