當應用管理員通告現(xiàn)在應用很慢、數(shù)據(jù)庫很慢時,當Oracle DBA在數(shù)據(jù)庫上做幾個示例的Select也發(fā)現(xiàn)同樣的問題時,有些時侯就會無從下手,因為DBA認為數(shù)據(jù)庫的各種命種率都是滿足Oracle文檔的建議。實際上如今的優(yōu)化己經(jīng)向優(yōu)化等待(waits)轉型了,實際中性能優(yōu)化最根本的出現(xiàn)點也都集中在I/O,這是影響性能最主要的方面,由系統(tǒng)中的等待去發(fā)現(xiàn)Oracle庫中的不足、操作系統(tǒng)某些資源利用的不合理是一個比較好的辦法。下面把一些實踐經(jīng)驗與大家分享,本文測重于Unix環(huán)境。 第一章 檢查系統(tǒng)的狀態(tài) 通過操作系統(tǒng)的一些工具檢查系統(tǒng)的狀態(tài),比如CPU、內存、交換、磁盤的利用率,根據(jù)經(jīng)驗或與系統(tǒng)正常時的狀態(tài)相比對,有時系統(tǒng)表面上看起來看空閑,這也可能不是一個正常的狀態(tài),因為cpu可能正等待IO的完成。除此之外,還應觀注那些占用系統(tǒng)資源(cpu、內存)的進程。 1.1 使用sar來檢查操作系統(tǒng)是否存在IO問題 #sar -u 2 10 -- 即每隔2秒檢察一次,共執(zhí)行20次。 結果示例: 注:在redhat下,%system就是所謂的%wio。 Linux 2.4.21-20.ELsmp (YY075) 05/19/2005 10:36:07 AM CPU %user %nice %system %idle 10:36:09 AM all 0.00 0.00 0.13 99.87 10:36:11 AM all 0.00 0.00 0.00 100.00 10:36:13 AM all 0.25 0.00 0.25 99.49 10:36:15 AM all 0.13 0.00 0.13 99.75 10:36:17 AM all 0.00 0.00 0.00 100.00 其中: Ø %usr指的是用戶進程使用的cpu資源的百分比; Ø %sys指的是系統(tǒng)資源使用cpu資源的百分比; Ø %wio指的是等待io完成的百分比,這是值得觀注的一項; Ø %idle即空閑的百分比。 如果wio列的值很大,如在35%以上,說明系統(tǒng)的IO存在瓶頸,CPU花費了很大的時間去等待I/O的完成。Idle很小說明系統(tǒng)CPU很忙。像以上的示例,可以看到wio平均值為11,說明I/O沒什么特別的問題,而idle值為零,說明cpu已經(jīng)滿負荷運行了。 當系統(tǒng)存在IO問題時,可以從以下幾個方面解決: Ø 聯(lián)系相應的操作系統(tǒng)的技術支持對這方面進行優(yōu)化,比如hp-ux在劃定卷組時的條帶化等方面。 Ø 查找Oracle中不合理的sql語句,對其進行優(yōu)化; Ø 對Oracle中訪問量頻繁的表除合理建索引外,再就是把這些表分表空間存放以免訪問上產(chǎn)生熱點,再有就是對表合理分區(qū)。 1.2 關注內存 常用的工具便是vmstat,對于hp-unix來說,可以用glance。Aix來說可以用topas。當發(fā)現(xiàn)vmstat中pi列非零,memory中的free列的值很小,glance、topas中內存的利用率多于80%時,這時說明內存方面應該調節(jié)一下。方法大體有以下幾項: Ø 劃給Oracle使用的內存不要超過系統(tǒng)內存的1/2,一般保在系統(tǒng)內存的40%為益。 Ø 為系統(tǒng)增加內存; Ø 如果你的連接特別多,可以使用MTS的方式; Ø 打全補丁,防止內存漏洞。 1.3 找到使用資源特別大的Oracle的session及其執(zhí)行的語句 Hp-unix可以用glance或top。IBM AIX可以用topas。此外可以使用ps的命令。 通過這些程序可以找到點用系統(tǒng)資源特別大的這些進程的進程號,就可以通過以下的sql語句發(fā)現(xiàn)這個pid正在執(zhí)行哪個sql,這個sql最好在pl/sql developer、toad等軟件中執(zhí)行: SELECT a.username, a.machine, a.program, a.sid, a.serial#, a.status, c.piece, c.sql_text FROM v$session a, v$process b, v$sqltext c WHERE b.spid = 'ORCL' AND b.addr = a.paddr AND a.sql_address = c.address(+) ORDER BY c.piece; 可以把得到的這個sql分析一下,看一下它的執(zhí)行計劃是否走索引。對其優(yōu)化避免全表掃描,以減少IO等待,從而加快語句的執(zhí)行速度。 提示:在做優(yōu)化sql時,經(jīng)常碰到使用in的語句,這時一定要用exists把它給換掉,因為Oracle在處理In時是按Or的方式做的,即使使用了索引也會很慢。比如: SELECT col1, col2, col3 FROM table1 a WHERE a.col1 NOT IN (SELECT col1 FROM table2) 可以換成: SELECT col1, col2, col3 FROM table1 a WHERE NOT EXISTS (SELECT 'x' FROM table2 b WHERE a.col1=b.col1) 1.4 查找前十條性能差的sql語句 SELECT * FROM (SELECT parsing_user_id, executions, sorts, command_type, disk_reads, sql_text FROM v$sqlarea ORDER BY disk_reads DESC) WHERE ROWNUM10; 第二章 檢查會話狀態(tài) 要快速發(fā)現(xiàn)Oracle Server的性能問題的原因,可以求助于v$session_wait視圖,看系統(tǒng)的這些session在等什么,使用了多少的IO。以下是參考腳本: -- 腳本說明:查看占I/O較大的正在運行的session: SELECT se.sid, se.serial#, pr.spid, se.username, se.status, se.terminal, se.program, se.module, se.sql_address, st.event, st.p1text, si.physical_reads, si.block_changes FROM v$session se, v$session_wait st, v$sess_io si, v$process pr WHERE st.sid=se.sid AND st.sid=si.sid AND se.PADDR=pr.ADDR AND se.sid>6 AND st.wait_time=0 AND st.event NOT LIKE '%SQL%' ORDER BY physical_reads DESC; 對檢索出的結果的幾點說明: 1. 以上是按每個正在等待的session已經(jīng)發(fā)生的物理讀排的序,因為它與實際的I/O相關。 2. 可以看一下這些等待的進程都在忙什么,語句是否合理? SELECT sql_address FROM v$session WHERE sid=; SELECT * FROM v$sqltext WHERE address=; 執(zhí)行以上兩個語句便可以得到這個session的語句。 也以用alter system kill session 'sid, serial#';把這個session殺掉。 3. 應觀注一下event列,這是調優(yōu)的關鍵一列,下面對常出現(xiàn)的event做以簡要的說明: 1) buffer busy waits,free buffer waits這兩個參數(shù)所標識是dbwr是否夠用的問題,與IO很大相關的,當v$session_wait中的free buffer wait的條目很小或沒有時,說明系統(tǒng)的dbwr進程決對夠用,不用調整;free buffer wait的條目很多,系統(tǒng)感覺起來一定很慢,這時說明dbwr已經(jīng)不夠用了,它產(chǎn)生的wio已經(jīng)成為數(shù)據(jù)庫性能的瓶頸,這時的解決辦法如下: Ø 增加寫進程,同時要調整db_block_lru_latches參數(shù): 示例:修改或添加如下兩個參數(shù) db_writer_processes=4 db_block_lru_latches=8 Ø 開異步IO。IBM這方面簡單得多,hp則麻煩一些,可以與Hp工程師聯(lián)系。 2) db file sequential read,指的是順序讀,即全表掃描,這也是應盡量減少的部分,解決方法就是使用索引、sql調優(yōu),同時可以增大db_file_multiblock_read_count這個參數(shù)。 3) db file scattered read參數(shù)指的是通過索引來讀取,同樣可以通過增加db_file_multiblock_read_count這個參數(shù)來提高性能。 4) latch free與栓相關,需要專門調節(jié)。 5) 其他參數(shù)可以不特別觀注