經典案例

服務(wù)創造價值、存在造就未來

當前位置:首頁(yè)>經典案例

數據庫維護技(jì )術方案

時間:2021-11-15   訪問量:1062

重慶石谷嚴格遵循以下流程進行數據庫系統安(ān)裝(zhuāng)配置工(gōng)作(zuò)。

圖二 數據庫系統安(ān)裝(zhuāng)流程圖

流程說明:

(1)數據庫協維人員根據數據庫要求,協助需求方評審,制定初步規劃。落實相關資源,并按需求方要求執行。

(2)數據庫協維人員進行安(ān)裝(zhuāng)調試,安(ān)裝(zhuāng)完畢之後測試。在此過程中(zhōng),系統協維人員給與必要的協助(創建帳号、賦予權限等)。

(3)系統協維人員在安(ān)裝(zhuāng)的服務(wù)器上修改服務(wù)器檔案,确保該服務(wù)器檔案反映了該服務(wù)器的最新(xīn)狀态。

(4)數據庫協維人員制定數據庫檔案,記錄新(xīn)安(ān)裝(zhuāng)的數據庫的狀态。

(5)測試沒有(yǒu)問題之後,該數據庫系統安(ān)裝(zhuāng)完畢,彙報相關人員及交付需求方使用(yòng)。

一、日常巡檢

        重慶石谷對數據庫日志(zhì)和對應主機日志(zhì)的巡檢工(gōng)作(zuò)制定了每日巡檢計劃,規定了巡檢工(gōng)作(zuò)的細粒度和頻率,數據庫協維工(gōng)程師依照巡檢計劃每天定時開展日志(zhì)檢查、告警日志(zhì)分(fēn)析、數據庫性能(néng)指标檢查、相關日志(zhì)清理(lǐ)等巡檢工(gōng)作(zuò)。

每日巡檢計劃模闆示例:

數據庫

數據庫日志(zhì)

主機日志(zhì)

性能(néng)指标

日志(zhì)清理(lǐ)

結果分(fēn)析

執行人

核心庫

3次/天

3次/天

5次/天

1次/1月

16點/天


務(wù)工(gōng)易

3次/天

3次/天

5次/天

1次/1月

16點/天


中(zhōng)央信息

3次/天

3次/天

5次/天

1次/1月

16點/天


IVR座席

3次/天

3次/天

5次/天

1次/1月

16點/天


二線(xiàn)客服

3次/天

3次/天

5次/天

1次/1月

16點/天


經分(fēn)

3次/天

3次/天

5次/天

1次/1月

16點/天


百事易

3次/天

3次/天

5次/天

1次/1月

16點/天


病蟲害

3次/天

3次/天

5次/天

1次/1月

16點/天


巡檢内容及報告模闆示例:

數據庫

數據庫日志(zhì)

主機日志(zhì)

監聽日志(zhì)

空間檢查

結果分(fēn)析

核心庫

alert_db.log

messages

listener.log

df -h

16點/天

務(wù)工(gōng)易

alert_db.log

messages

listener.log

df -h

16點/天

中(zhōng)央信息

alert_db.log

messages

listener.log

df -h

16點/天

IVR座席

alert_db.log

messages

listener.log

df -h

16點/天

二線(xiàn)客服

alert_db.log

messages

listener.log

df -h

16點/天

經分(fēn)

alert_db.log

messages

listener.log

df -h

16點/天

百事易

alert_db.log

messages

listener.log

df -h

16點/天

病蟲害

alert_db.log

messages

listener.log

df -h

16點/天

  指标内容及報告模闆示例:

數據庫

表空間檢查

TOPSQL

當前會話

失效索引

無效對象檢查

核心庫

腳本

awr報告

腳本

腳本

腳本

務(wù)工(gōng)易

腳本

awr報告

腳本

腳本

腳本

中(zhōng)央信息

腳本

awr報告

腳本

腳本

腳本

IVR座席

腳本

awr報告

腳本

腳本

腳本

二線(xiàn)客服

腳本

awr報告

腳本

腳本

腳本

經分(fēn)

腳本

awr報告

腳本

腳本

腳本

百事易

腳本

awr報告

腳本

腳本

腳本

病蟲害

腳本

awr報告

腳本

腳本

腳本

    巡檢操作(zuò)方式示例:

ftp 192.168.180.62  oracle 用(yòng)戶登錄

在如下目錄 獲取當日目錄所有(yǒu)信息,然後發給相關負責人。

/home/oracle/rpt_pday/

drwxr-xr-x  2 oracle oinstall 4096 Mar 22 09:26 20120322

在檢查日志(zhì)時,查看有(yǒu)無“ORA-”,Error”,“Failed”等出錯信息,發現錯誤提示信息,根據錯誤進行分(fēn)析,判斷、處理(lǐ),事後對相關信息做備案,反饋相關人員。

二、長(cháng)周期及特殊時期維護

要保持數據庫安(ān)全穩定運行,需要全面的巡檢和維護計劃,重慶石谷制定了長(cháng)期及特殊時期維護作(zuò)業計劃。

數據庫周期維護計劃表:

維護數據庫


維護日期


維護記錄

頻率

維護内容

備注

月度

  1. 業務(wù)過期數據下線(xiàn)清理(lǐ),回收空間

  2. 數據庫文(wén)件系統使用(yòng)率檢查

  3. 檢查表空間碎片,并做相應的處理(lǐ)


季度

  1. 數據庫備份恢複測試,驗證介質(zhì)可(kě)用(yòng)性

  2. 數據庫相關日志(zhì),備份清理(lǐ)

  3. 對現網數據庫無效對象确認及清理(lǐ)


半年

1、數據庫安(ān)全補丁升級

2、對數據庫運行參數值檢查,性能(néng)評估、調整


一年

1、對數據庫做一次全面健康檢查工(gōng)作(zuò)

2、根據本年度運行維護總結,提出下一年相關資源需求計劃








數據庫日常運行過程中(zhōng),因某種原因導緻重大事件,為(wèi)了保證12582基地的可(kě)用(yòng)性,定制數據庫重大事件處理(lǐ)作(zuò)業計劃。

數據庫重大事件處理(lǐ)計劃表:

數據庫


維護日期


維護記錄

事件

處理(lǐ)過程

備注

參數不對

檢查初始化參數文(wén)件是否正常


控制文(wén)件損壞

1.确保數據庫已經關閉,如果沒有(yǒu)用(yòng)下面的命令來關閉數據庫:

racdbl>shutdown immediate;

2.查看初始化文(wén)件$ORACLE_BASE/admin/pfile/initORCL.ora,确定所有(yǒu)控制文(wén)件的路徑。

3.用(yòng)操作(zuò)系統命令将其它正确的控制文(wén)件覆蓋錯誤的控制文(wén)件。

4.用(yòng)下面的命令重新(xīn)啓動數據庫:

racdbl >startup;

5.用(yòng)适當的方法進行數據庫全備份。

損壞所有(yǒu)的控制文(wén)件:

1.确保數據庫已經關閉,如果沒有(yǒu)用(yòng)下面的命令來關閉數據庫:

racdbl >shutdown immediate;

2.從相應的備份結果集中(zhōng)恢複最近的控制文(wén)件。對于沒有(yǒu)采用(yòng)帶庫備份的點可(kě)以直接從磁帶上将最近的控制文(wén)件備份恢複到相應目錄;對于采用(yòng)帶庫備份的點用(yòng)相應的rman腳本來恢複最近的控制文(wén)件。

3.用(yòng)下面的命令來創建産(chǎn)生數據庫控制文(wén)件的腳本:

racdbl >startup mount;

racdbl >alter database backup controlfile to trace noresetlogs;

4.修改第三步産(chǎn)生的trace文(wén)件,将其中(zhōng)關于創建控制文(wén)件的一部分(fēn)語句拷貝出來并做些修改,使得它能(néng)夠體(tǐ)現最新(xīn)的數據庫結構。假設産(chǎn)生的sql文(wén)件名(míng)字為(wèi)createcontrol.sql.

注意:

Trace文(wén)件的具(jù)體(tǐ)路徑可(kě)以在執行完第3步操作(zuò)後查$ORACLE_

BASE/admin/bdump/alert_ORCL.ora文(wén)件來确定。

5.用(yòng)下面命令重新(xīn)創建控制文(wén)件:

racdbl >shutdown abort;

racdbl >startup nomount;

racdbl >@createcontrol.sql;

6.用(yòng)适當的方法進行數據庫全備份。


重做日志(zhì)文(wén)件損壞:

數據庫的所有(yǒu)增、删、改都會記錄入重做日志(zhì)。如果當前激活的重做日志(zhì)文(wén)件損壞,會導緻數據庫異常關閉。非激活的重做日志(zhì)最終也會因為(wèi)日志(zhì)切換變為(wèi)激活的重做日志(zhì),所以損壞的非激活的重做日志(zhì)最終也會導緻數據庫的異常終止。在ipas/mSwitch中(zhōng)每組重做日志(zhì)隻有(yǒu)一個成員,所以在下面的分(fēn)析中(zhōng)隻考慮重做日志(zhì)組損壞的情況,而不考慮單個重做日志(zhì)成員損壞的情況。

确定損壞的重做日志(zhì)的位置及其狀态:

1.如果數據庫處于可(kě)用(yòng)狀态:

select * from v$logfile;

racdbl >select * from v$log;

2.如果數據庫處于已經異常終止:

racdbl >startup mount;

racdbl >select * from v$logfile;

svrmgrl>select * from v$log;

其中(zhōng),logfile的狀态為(wèi)INVALID表示這組日志(zhì)文(wén)件出現已經損壞;log狀态為(wèi)Inactive:表示重做日志(zhì)文(wén)件處于非激活狀态;Active: 表示重做日志(zhì)文(wén)件處于激活狀态;Current:表示是重做日志(zhì)為(wèi)當前正在使用(yòng)的日志(zhì)文(wén)件。

損壞的日志(zhì)文(wén)件處于非激活狀态:

1.删除相應的日志(zhì)組:

racdbl >alter database drop logfile group group_number;

2.重新(xīn)創建相應的日志(zhì)組:

racdbl >alter database add log file group group_number (’log_file_descritpion’,…) size log_file_size;

損壞的日志(zhì)文(wén)件處于激活狀态且為(wèi)非當前日志(zhì):

1.清除相應的日志(zhì)組:

racdbl>alter database clear unarchived logfile group group_number;

損壞的日志(zhì)文(wén)件為(wèi)當前活動日志(zhì)文(wén)件:

用(yòng)命令清除相應的日志(zhì)組:

racdbl>alter database clear unarchived logfile group group_number;

如果清除失敗,則隻能(néng)做基于時間點的不完全恢複。

打開數據庫并且用(yòng)适當的方法進行數據庫全備份:

racdbl >alter database open;

部分(fēn)數據文(wén)件損壞:

若損壞的數據文(wén)件屬于非system表空間,則數據庫仍然可(kě)以處于打開狀态可(kě)以進行操作(zuò),隻是損壞的數據文(wén)件不能(néng)訪問。這時在數據庫打開狀态下可(kě)以單獨對損壞的數據文(wén)件進行恢複。若是system表空間的數據文(wén)件損壞則數據庫系統會異常終止。這時數據庫隻能(néng)以Mount方式打開,然後再對數據文(wén)件進行恢複。可(kě)以通過查看數據庫日志(zhì)文(wén)件來判斷當前損壞的數據文(wén)件到底是否屬于system表空間。



上一篇:網絡設備運維技(jì )術方案

下一篇:IT外包服務(wù)技(jì )術方案

在線(xiàn)咨詢

點擊這裏給我發消息 售前咨詢專員

點擊這裏給我發消息 售後服務(wù)專員

在線(xiàn)咨詢

免費通話

24小(xiǎo)時免費咨詢

請輸入您的聯系電(diàn)話,座機請加區(qū)号

免費通話

微信掃一掃

微信聯系
返回頂部