пятница, 14 января 2011 г.

Логическое залипание носителя

При восстановлении информации в NetBackup возникает ситуация, когда требуемый носитель уже используется другой задачей. В таком случае задача восстановления приостанавливается со статусом Media in use (ID-ленты) и должна продолжиться при освобождении требуемого носителя. К сожалению зачастую этот механизм дает сбой и задача не продолжается после освобождения носителя, считая, что он все еще занят. Рассмотрим порядок разрешения ситуации на конкретном примере.

Моя задача зависла со статусом Media in use (AB0196). Поищем кто держит носитель по мнению NetBackup:

 [ nbserver / ] # /usr/openv/netbackup/bin/admincmd/nbrbutil -dump | grep AB0196
         index=0 (Request provider=DriveOperationProvider resourcename=MEDIA RESOURCE  userSequence=0 (MediaRequest: mediaId=AB0196 mediaServer=junior mediaKey=0 userReservationId= assignedTime=0 client=v890test-backup usageType=2 mustBeNdmp=no driveName= drivePath= mediaPool= robotNumber=-1 slotNumber=-1 density=-1 ndmpControlHost= failIfNoMedia=yes externalFile= mediaType=2 mediaSubType=0 isNdmp=false isTirRestore=false isFlashbackupRestore=false isBlockMapRead=false isCatalogBackup=false isGcsCatalogBackup=false isVMWare=false isLifeCycle=false preferVtlToDirectAttachedTape=false useFt=true failIfNoFt=true isGranularExchange=false REQ_IS_HYPER_V=false)))
         index=3 (Allocation: id={51E64B6C-1DD2-11B2-86CB-00144FEBAB76} provider=DriveOperationProvider resourcename=AB0196 masterserver=nbserver groupid={00000000-0000-0000-0000-000000000000} userSequence=0 userid="jobid=1501818" (Media_Drive_Allocation_Record: allocationKey=321310 (Media_Drive_Record: MediaKey=4000136 MediaId=AB0196 MediaServer=junior DriveKey=2000003 DriveName=HPUltrium3-SCSI1 PrimaryPath=/dev/rmt/0cbn PoolName=berdb2 RobotNum=0 RobotType=8 MediaTypeName=NetBackup HCART3 DriveTypeName=NetBackup HCART3 NdmpControlHost= RetentionLevel=0 PolicyType=2 JobType=2 MasterServer=nbserver) (Storage_Unit_Record: STU= STUType=0 MasterServer= MediaServer= RobotType=0 RobotNumber=0 Density=0 OnDemandOnly=0 ConcurrentJobs=0 ActiveJobs=0 MaxMultiplexing=0 NdmpAttachHost= AbsolutePath=) (Bptm_Strings_Record: 0="MEDIADB 1 321310 AB0196 4000136 ------ 20 1294285437 1294734187 1295338987 1294841144 998444736 151 150 0 27 27 8 1024 0 3885917 0" 1="VOLUME 1 AB0196 4000136 AB0196 berdb2 FUJIFILM 05OB101912 24 8 0 136 0 {00000000-0000-0000-0000-000000000000} 0" 2="DRIVE 3 HPUltrium3-SCSI1 2000003 HU10528BP6 /dev/rmt/0cbn -1 -1 -1 -1 -1 -1 -1 -1 *NULL* *NULL* *NULL* *NULL* 1 16 0 1 0 0" 3="STORAGE 1 *NULL* 0 0 0 0 0 0 junior junior *NULL*" 4="DISKGROUP 0 6 *NULL* 6 *NULL* 6 *NULL*" 5="DISKVOLUME 0 6 *NULL* 6 *NULL* 0" 6="DISKMOUNTPOINT 0 6 *NULL*" ) TpReqFileName=))
         index=4 (Allocation: id={A9DB943E-1DD1-11B2-B47E-00144FEBAB76} provider=DriveOperationProvider resourcename=AB0196 masterserver=nbserver groupid={00000000-0000-0000-0000-000000000000} userSequence=0 userid="jobid=1502257" (Media_Drive_Allocation_Record: allocationKey=321359 (Media_Drive_Record: MediaKey=4000136 MediaId=AB0196 MediaServer=junior DriveKey=2000010 DriveName=HP.ULTRIUM3-SCSI.000 PrimaryPath=/dev/rmt/4cbn PoolName=berdb2 RobotNum=0 RobotType=8 MediaTypeName=NetBackup HCART3 DriveTypeName=NetBackup HCART3 NdmpControlHost= RetentionLevel=0 PolicyType=2 JobType=2 MasterServer=nbserver) (Storage_Unit_Record: STU= STUType=0 MasterServer= MediaServer= RobotType=0 RobotNumber=0 Density=0 OnDemandOnly=0 ConcurrentJobs=0 ActiveJobs=0 MaxMultiplexing=0 NdmpAttachHost= AbsolutePath=) (Bptm_Strings_Record: 0="MEDIADB 1 321359 AB0196 4000136 ------ 20 1294285437 1294734187 1295338987 1294936237 998444736 151 150 0 27 70 8 1024 0 3885917 0" 1="VOLUME 1 AB0196 4000136 AB0196 berdb2 FUJIFILM 05OB101912 24 8 0 136 0 {00000000-0000-0000-0000-000000000000} 0" 2="DRIVE 3 HP.ULTRIUM3-SCSI.000 2000010 HU10815954 /dev/rmt/4cbn -1 -1 -1 -1 -1 -1 -1 -1 *NULL* *NULL* *NULL* *NULL* 1 16 0 1 0 0" 3="STORAGE 1 *NULL* 0 0 0 0 0 0 junior junior *NULL*" 4="DISKGROUP 0 6 *NULL* 6 *NULL* 6 *NULL*" 5="DISKVOLUME 0 6 *NULL* 6 *NULL* 0" 6="DISKMOUNTPOINT 0 6 *NULL*" ) TpReqFileName=))
        MdsAllocation: allocationKey=321359 jobType=2 mediaKey=4000136 mediaId=AB0196 driveKey=2000010 driveName=HP.ULTRIUM3-SCSI.000 drivePath=/dev/rmt/4cbn stuName= masterServerName=nbserver mediaServerName=junior ndmpTapeServerName= diskVolumeKey=0 mountKey=0 linkKey=0 fatPipeKey=0 scsiResType=1 serverStateFlags=1
 Нас интересует параметр allocationKey, чтобы воспользоваться ключем
  -releaseMDS     -- Release EMM/MDS allocations by MDS
                                      allocation ID
Выполняем
 [ nbserver / ] # /usr/openv/netbackup/bin/admincmd/nbrbutil -releaseMDS 321359
После чего проблема исчезает.

2 комментария:

  1. и куда исчезает проблема? Она просто обретает новую форму :) Тебе также будет интересен ключ -cleandump.

    ОтветитьУдалить
  2. Задача отваливается и может быть запущена повторна. Т.е. носитель освобождается. Проблемой тут назван не невыполняющаяся задача, а занятый носитель.

    ОтветитьУдалить