mysql数据库优化建议


应用程序、网站和数据库之间的交互会直接影响到应用服务水平的确立。

这种交互的一个核心组成部分是:各种应用程序如何去查询数据库,以及数据库是如何响应各种请求的。

MySQL 数据库性能的 7 点必备技巧:

  • 学习如何使用EXPLAIN

  • 创建正确的索引

  • 拒绝默认设置

  • 将数据库载入内存中

  • 使用SSD存储

  • 横向扩展

  • 追求可视性

一、EXPLAIN 命令

输出有两种不同的格式:老式的表格形式和较新的、能够提供更为细节化的、结构化的 JSON 文档。

1
mysql> explain format=json select avg(k) from sbtest1 where id between 1000 and 2000 \G

二、创建正确的索引

索引是通过减少在数据库里查询时,必须扫描的数据量来提高查询的自身效率。

在 MySQL 中,索引被用于加快对数据库的访问,并有助于遵循数据库的各种约束(例如 UNIQUE 和 FOREIGN KEY)。

数据库索引就像书的索引一样,它们的位置信息被保存,并且包含有数据库的主要信息。

它们是数据位置的一种参考方法或映射,因此索引并不会更改数据库中的任何数据。它们只是指向数据存放的位置而已。

不过,索引并不总能匹配上任何的负载请求。在系统运行中,您应当不断为查询的上下文环境创建各种索引。

虽然有着良好索引的数据库会运行更快速,但是如果出现单个索引的缺失,则会拖慢整个数据库的效率。

因此,我们需要使用 EXPLAIN 来查找缺失的索引,并将其添加上去。

需要注意的是:不要添加您所不需要的索引,因为不必要的索引会反过来拖慢数据库。

三、拒绝默认设置

就像其他任何软件那样,MySQL 也能通过各种可配置的设置,来修改其行为并最终优化其性能。

同时这些配置的设置经常会被管理员所忽略,并一直保持着默认值的状态。

为了让 MySQL 获得最佳的性能,了解如何配置 MySQL,以及将它们设置为最适合您的数据库环境的状态是非常重要的。

在默认情况下,MySQL 是针对小规模的发布、安装进行调优的,而并非真正的生产环境规模。

因此,通常您需要将 MySQL 配置为使用所有可用的内存资源,并且能允许您的应用程序所需的最大连接数。

这里有三个有关 MySQL 性能优化的设置,值得您去仔细地配置:

innodb_buffer_pool_size

数据和索引被用作缓存的缓冲池。当您的数据库服务器有着大量的系统内存时,可以用到该设置。

如果您只运行 InnoDB 存储引擎,那么您通常可以分配 80% 左右的内存给该缓冲池。

而如果您要运行非常复杂的查询或者您有大量的并发数据库连接,亦或您有非常大的数据表的情况,那么就可能需要将此值下调一个等级,以便为其他的调用分配更多的内存。

您在设置 InnoDB 缓冲池大小的时候,要确保其设置既不要过大,也不要频繁引起交换(swapping),因为这些绝对会降低您的数据库性能。有一个简单的检查方法就是在“Percona 监控和管理”。

如果您一开始并没有将 innodb_buffer_pool_size 的值设置正确,也不必担心。

从 MySQL 5.7 开始,您可以动态地改变 InnoDB 缓冲池的大小,而不需要重新启动数据库服务器了。

innodb_log_file_size

这是指单个 InnoDB 日志文件的大小。默认情况下,InnoDB 使用两个值,这样您就可以通过将其增加一倍,来让 InnoDB 获得循环的重做日志空间,以确保交易的持久性。这同时也优化了对数据库的写入性能。

设置 innodb_log_file_size 的值是很值得推敲的:如果分配了较大的重做空间,那么对于写入密集型的工作负载来说性能会越好。

但是如果您的系统遭受到断电或其他问题导致崩溃的时候,那么其恢复时间则会越长。

您可能会问:怎么才能知道自己的 MySQL 性能是否受限于当前的 InnoDB 日志文件大小呢?

您可以通过查看未实际使用的重做日志空间大小来判定。最简单的方法就是查看“Percona 监控和管理”的 InnoDB 指标仪表板。因此,您的日志文件应该至少比使用量大 20%,从而保持系统处于最佳的性能状态。

max_connections

大型应用程序通常需要比默认数量多得多的连接。不同于其他的变量,如果您没能将该值设置正确,您就会碰到性能方面的问题。

也就是说,如果连接的数量不足以满足您的应用需求,那么应用程序将根本无法连接到数据库,在用户看来就像宕机了一样。由此可见,将它设置正确是非常重要的。

对于在多台服务器上运行着具有多个组件的复杂应用来说,您想获知到底需要多少个连接是非常困难的。

幸运的是,MySQL 能够在峰值操作时轻易地获悉所用到的连接数量。通常,您需要确保在应用程序所使用到的最大连接数和可用的最大连接数之间至少有 30% 的差额。

查看这些数字的一个简单方法是:在“Percona 监控和管理”的系统概述界面中查看使用 MySQL 连接图。

还有一点需要记住:如果您的应用程序所创建的连接数量过多,通常会导致数据库运行缓慢。

在这种情况下,您应该在数据库性能上做文章,而不是简单地允许建立更多的连接。更多的连接会使得潜在的性能问题更加恶化。

四、将数据库载入内存中

年来,出现了固态硬盘(SSD)方向上的转变。尽管固态硬盘比传统机械旋臂硬盘快得多,但是它们仍然敌不过将数据存在内存里。

这种差别不仅来自于存储性能本身,还来自于数据库从磁盘或 SSD 里存取数据时所产生的额外工作。

随着近年来硬件技术的改进,不管您是运行在云端,还是管理着自己的硬件,将数据库载入内存已经变得可行

五、使用 SSD 存储

无论您的数据库是否已被载入内存,您都需要使用快速存储来处理写入操作,并且避免在数据库启动后(重启之后)出现性能问题。这里的快速存储就是指固态硬盘。

一些所谓的“专家”仍在基于成本和可靠性的基础上,主张使用机械旋臂硬盘。坦率地说,当涉及到数据库操作时,这些建议往往是过时的或是完全错误的。现如今,固态硬盘的性能已经非常卓越、可靠且价格低廉了。

并非所有的固态硬盘都是同等生产的。对于数据库服务器来说,您应该选用那些专供服务器工作负载、且能精心呵护数据的 SSD。

例如:防止断电损坏的,而避免使用那些专为台式和笔记本电脑设计的商用固态硬盘。

通过 NVMe 或英特尔 Optane 技术来直接连接的 SSD 往往能够提供最佳的性能。

即使远程连接到 SAN、NAS 或云端的块设备上,固态硬盘也能比机械旋臂硬盘提供更为优越的性能。

六、横向扩展

即使是性能最高的服务器也有局限性。业界一般用两种方法来进行扩展:纵向和横向。

纵向扩展意味着购买更多的硬件。这样做不但成本昂贵,而且硬件折旧速度快。

而横向扩展,则在处理负载方面有如下几点优势:

  • 您可以从更小型、成本更低的系统中获益。
  • 横向扩展使得系统的线性扩展更方便、更快捷。
  • 由于数据库会横跨增长到多个物理机上,横向扩展在保护数据库的同时,消除了硬件单点故障。

尽管横向扩展有着诸多优势,不过它还是具有一定的局限性。横向扩展需要数据复制,例如基本的 MySQL Replication 或是用于数据同步的 Percona XtraDB 群集。

但是作为回报,您也会获得更高的性能和可用性。如果您需要更高级的扩展性,那么请考虑使用 MySQL 分片(sharding)。

另外,您还需要确保连接到群集架构的应用程序可以找到它们所需的数据。这通常是通过诸如 ProxySQL 或 HAProxy 的一些代理服务器和负载平衡器来实现的。

当然,过早地规划横向扩展,会增加分布式数据库的复杂性。最近发布的 MySQL 8 候选版本已声称自己能够在单一的系统上处理超过 200 万个简单查询。

七、追求可视性

可视性是系统设计的最佳境界,MySQL 也不例外。

一旦完成了 MySQL 环境的搭建、运行并调优,您千万不要认为已经万事大吉了。

数据库环境既会受到来自系统更改或流量负荷的影响,也会遇到例如流量高峰、应用程序错误以及 MySQL 自身的各种问题。

为了快速、有效地解决各种问题,您需要建立和实施一些监控机制,从而能获悉数据库环境的状态,并在出现错误时及时分析服务器上的数据。

因此理想情况就是在系统出现问题或是被用户所察觉之前就做到防范于未然。

常用的监测工具有:

  • MySQL企业监控器(Enterprise Monitor)。
  • Monyog。
  • 具有免费与开源版本的 Percona 监控和管理(PMM)。

这些工具在监控和故障排除方面提供了很好的操作可视性。

随着越来越多的公司在大规模生产环境中使用开源的数据库(特别是MySQL)来管理和服务他们的业务数据,他们需要把工作重心放在保持数据库的调优和运行效率上。

MySQL 的确是一款能够提升您的应用程序和网站性能的优秀数据库,当然您需要通过对它进行调整,以满足业务需求,监测、发现并防止任何瓶颈和性能方面的问题。

坚持原创技术分享,您的支持将鼓励我继续创作!