俞新兰 發表於 2023-10-27 00:00:00

当数据库变慢时的解决方法

<p>
        <strong>第一章 检查系统的状态</strong><br>
        1.1 使用sar来检查操作系统是否存在IO问题<br>
        1.2 关注内存vmstat<br>
        1.3 找到使用资源特别大的Oracle的session及其执行的语句<br>
        1.4 查找前十条性能差的sql语句<br><strong>第二章 检查会话状态</strong><br>
        当数据库变慢时,我们应如何入手<br><br>
        当应用管理员通告现在应用很慢、数据库很慢时,当Oracle DBA在数据库上做几个示例的Select也发现同样的问题时,有些时侯就会无从下手,因为DBA认为数据库的各种命种率都是满足Oracle文档的建议。实际上如今的优化己经向优化等待(waits)转型了,实际中性能优化最根本的出现点也都集中在I/O,这是影响性能最主要的方面,由系统中的等待去发现Oracle库中的不足、操作系统某些资源利用的不合理是一个比较好的办法。下面把一些实践经验与大家分享,本文测重于Unix环境。<br>
        第一章 检查系统的状态<br>
        通过操作系统的一些工具检查系统的状态,比如CPU、内存、交换、磁盘的利用率,根据经验或与系统正常时的状态相比对,有时系统表面上看起来看空闲,这也可能不是一个正常的状态,因为cpu可能正等待IO的完成。除此之外,还应观注那些占用系统资源(cpu、内存)的进程。<br>
        1.1 使用sar来检查操作系统是否存在IO问题<br>
        #sar -u 2 10 -- 即每隔2秒检察一次,共执行20次。<br>
        结果示例:<br>
        注:在redhat下,%system就是所谓的%wio。<br>
        Linux 2.4.21-20.ELsmp (YY075) 05/19/2005<br>
        10:36:07 AM CPU %user %nice %system %idle<br>
        10:36:09 AM all 0.00 0.00 0.13 99.87<br>
        10:36:11 AM all 0.00 0.00 0.00 100.00<br>
        10:36:13 AM all 0.25 0.00 0.25 99.49<br>
        10:36:15 AM all 0.13 0.00 0.13 99.75<br>
        10:36:17 AM all 0.00 0.00 0.00 100.00<br>
        其中:<br>
        Ø %usr指的是用户进程使用的cpu资源的百分比;<br>
        Ø %sys指的是系统资源使用cpu资源的百分比;<br>
        Ø %wio指的是等待io完成的百分比,这是值得观注的一项;<br>
        Ø %idle即空闲的百分比。<br>
        如果wio列的值很大,如在35%以上,说明系统的IO存在瓶颈,CPU花费了很大的时间去等待I/O的完成。Idle很小说明系统CPU很忙。像以上的示例,可以看到wio平均值为11,说明I/O没什么特别的问题,而idle值为零,说明cpu已经满负荷运行了。<br>
        当系统存在IO问题时,可以从以下几个方面解决:<br>
        Ø 联系相应的操作系统的技术支持对这方面进行优化,比如hp-ux在划定卷组时的条带化等方面。<br>
        Ø 查找Oracle中不合理的sql语句,对其进行优化;<br>
        Ø 对Oracle中访问量频繁的表除合理建索引外,再就是把这些表分表空间存放以免访问上产生热点,再有就是对表合理分区。<br>
        1.2 关注内存<br>
        常用的工具便是vmstat,对于hp-unix来说,可以用glance。Aix来说可以用topas。当发现vmstat中pi列非零,memory中的free列的值很小,glance、topas中内存的利用率多于80%时,这时说明内存方面应该调节一下。方法大体有以下几项:<br>
        Ø 划给Oracle使用的内存不要超过系统内存的1/2,一般保在系统内存的40%为益。<br>
        Ø 为系统增加内存;<br>
        Ø 如果你的连接特别多,可以使用MTS的方式;<br>
        Ø 打全补丁,防止内存漏洞。<br>
        1.3 找到使用资源特别大的Oracle的session及其执行的语句<br>
        Hp-unix可以用glance或top。IBM AIX可以用topas。此外可以使用ps的命令。<br>
        通过这些程序可以找到点用系统资源特别大的这些进程的进程号,就可以通过以下的sql语句发现这个pid正在执行哪个sql,这个sql最好在pl/sql developer、toad等软件中执行:<br>
        SELECT a.username, a.machine, a.program, a.sid, a.serial#, a.status,<br>
        c.piece, c.sql_text<br>
        FROM v$session a, v$process b, v$sqltext c<br>
        WHERE b.spid = 'ORCL'<br>
        AND b.addr = a.paddr<br>
        AND a.sql_address = c.address(+)<br>
        ORDER BY c.piece;<br>
        可以把得到的这个sql分析一下,看一下它的执行计划是否走索引。对其优化避免全表扫描,以减少IO等待,从而加快语句的执行速度。<br>
        提示:在做优化sql时,经常碰到使用in的语句,这时一定要用exists把它给换掉,因为Oracle在处理In时是按Or的方式做的,即使使用了索引也会很慢。比如:<br>
        SELECT col1, col2, col3 FROM table1 a<br>
        WHERE a.col1 NOT IN (SELECT col1 FROM table2)<br>
        可以换成:<br>
        SELECT col1, col2, col3 FROM table1 a<br>
        WHERE NOT EXISTS<br>
        (SELECT 'x' FROM table2 b WHERE a.col1=b.col1)<br>
        1.4 查找前十条性能差的sql语句<br>
        SELECT * FROM (SELECT parsing_user_id, executions, sorts, command_type,<br>
        disk_reads, sql_text FROM v$sqlarea<br>
        ORDER BY disk_reads DESC)<br>
        WHERE ROWNUM&lt;10;<br>
        第二章 检查会话状态<br>
        要快速发现Oracle Server的性能问题的原因,可以求助于v$session_wait视图,看系统的这些session在等什么,使用了多少的IO。以下是参考脚本:<br>
        -- 脚本说明:查看占I/O较大的正在运行的session:<br>
        SELECT se.sid, se.serial#, pr.spid, se.username, se.status, se.terminal,<br>
        se.program, se.module, se.sql_address, st.event, st.p1text,<br>
        si.physical_reads, si.block_changes<br>
        FROM v$session se, v$session_wait st, v$sess_io si, v$process pr<br>
        WHERE st.sid=se.sid AND st.sid=si.sid<br>
        AND se.PADDR=pr.ADDR<br>
        AND se.sid&gt;6<br>
        AND st.wait_time=0<br>
        AND st.event NOT LIKE '%SQL%'<br>
        ORDER BY physical_reads DESC;<br>
        对检索出的结果的几点说明:<br>
        1. 以上是按每个正在等待的session已经发生的物理读排的序,因为它与实际的I/O相关。<br>
        2. 可以看一下这些等待的进程都在忙什么,语句是否合理?<br>
        SELECT sql_address FROM v$session WHERE sid=;<br>
        SELECT * FROM v$sqltext WHERE address=;<br>
        执行以上两个语句便可以得到这个session的语句。<br>
        也以用alter system kill session 'sid, serial#';把这个session杀掉。<br>
        3. 应观注一下event列,这是调优的关键一列,下面对常出现的event做以简要的说明:<br>
        1) buffer busy waits,free buffer waits这两个参数所标识是dbwr是否够用的问题,与IO很大相关的,当v$session_wait中的free buffer wait的条目很小或没有时,说明系统的dbwr进程决对够用,不用调整;free buffer wait的条目很多,系统感觉起来一定很慢,这时说明dbwr已经不够用了,它产生的wio已经成为数据库性能的瓶颈,这时的解决办法如下:<br>
        Ø 增加写进程,同时要调整db_block_lru_latches参数:<br>
        示例:修改或添加如下两个参数<br>
        db_writer_processes=4<br>
        db_block_lru_latches=8<br>
        Ø 开异步IO。IBM这方面简单得多,hp则麻烦一些,可以与Hp工程师联系。<br>
        2) db file sequential read,指的是顺序读,即全表扫描,这也是应尽量减少的部分,解决方法就是使用索引、sql调优,同时可以增大db_file_multiblock_read_count这个参数。<br>
        3) db file scattered read参数指的是通过索引来读取,同样可以通过增加db_file_multiblock_read_count这个参数来提高性能。<br>
        4) latch free与栓相关,需要专门调节。<br>
        5) 其他参数可以不特别观注</p>
頁: [1]
查看完整版本: 当数据库变慢时的解决方法