четверг, 10 февраля 2011 г.

По причине непрохождения бэкапа Exchange 2007 посредствоом NetBackup - переустановка пассивного узла CCR кластера Exchange 2007

Приняли решение переустановить пассивный узел CCR кластера Exchange 2007, по причине невозможности сделать резервную копию баз Exchange посредством NetBackup версии 7.0.1
На самом деле он стал пассивным на время переустановки.
Подробности:
На одном из узлов (MAIL-MBS-02) Exchange 2007 CCR кластера столкнулись с ошибкой:

Нашел в интернете: http://support.microsoft.com/kb/940184
Проверил:

т.е. ни одного «писателя» не отобразилось, в то время, как на пассивном узле кластера (MAIL_MBS-01) всё нормально:

на MAIL-MBS-02 опробовал методы описанный в вышеприведенной статье Microsoft:

1. Click Start, click Run, type Regedit, and then click OK.
2. Locate and then click the following registry subkey:
HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\EventSystem\{26c409cc-ae86-11d1-b616-00805fc79216}\Subscriptions
3. On the Edit menu, click Delete, and then click Yes to confirm that you want to delete the subkey.
4. Exit Registry Editor.
5. Click Start, click Run, type services.msc, and then click OK.
6. Right-click the following services one at a time. For each service, click Restart:
o COM+ Event System
o COM+ System Application
o Microsoft Software Shadow Copy Provider
o Volume Shadow Copy
7. Click Start, click Run, type cmd, and then click OK.
8. At the command prompt, type vssadmin list writers, and then press ENTER.
9. If the VSS writers are now listed, close the Command Prompt window. You do not have to complete the remaining steps.

If the VSS writers are not listed, type the following commands at the command prompt. Press ENTER after each command.
o cd /d %windir%\system32
o net stop vss
o net stop swprv
o regsvr32 ole32.dll
o regsvr32 oleaut32.dll
o regsvr32 /i eventcls.dll
o regsvr32 vss_ps.dll
o vssvc /register
o regsvr32 /i swprv.dll
o regsvr32 es.dll
o regsvr32 stdprov.dll
o regsvr32 vssui.dll
o regsvr32 msxml.dll
o regsvr32 msxml3.dll
o regsvr32 msxml4.dll
Note The last command may not run successfully.
10. At the command prompt, type vssadmin list writers, and then press ENTER.
11. Confirm that the VSS writers are now listed.


После чего в получил:

Как видно, ситуация улучшилась, но не достигла показателей MAIL_MBS-02 - здесь их значительно меньше.

После этого я выкачал и опробовал Microsoft Fix it 50498 из статьи базы знаний http://support.microsoft.com/kb/940184
думая, что то улучшиться, но этого не произошло – осталась такая же картина как на последнем скриншоте.

Таким образом, появились только:

Writer name: 'MSDEWriter'
Writer Id: {f8544ac1-0611-4fa5-b04b-f7ee00b03277}
Writer Instance Id: {82b36d12-14f4-454b-93ad-5d22bf02d33c}
State: [1] Stable
Last error: No error

Writer name: 'Registry Writer'
Writer Id: {afbab4a2-367d-4d15-a586-71dbb18f8485}
Writer Instance Id: {bc6c04b6-f138-4752-91af-6ca239d48fa5}
State: [1] Stable
Last error: No error

Writer name: 'Event Log Writer'
Writer Id: {eee8c692-67ed-4250-8d86-390603070d00}
Writer Instance Id: {fa8822f7-8daf-425a-8dfa-ad82c0164705}
State: [1] Stable
Last error: No error

Writer name: 'COM+ REGDB Writer'
Writer Id: {542da469-d3e1-473c-9f4f-7847f01fc64f}
Writer Instance Id: {1dcd4ff3-b0bd-44dd-953e-72b715fb3a88}
State: [1] Stable
Last error: No error


в то время, как должны были:

Writer name: 'System Writer'
Writer Id: {e8132975-6f93-4464-a53e-1050253ae220}
Writer Instance Id: {4c2f53f9-8cc2-48e5-b4dd-cb9079f4fbd4}
State: [1] Stable
Last error: No error

Writer name: 'Microsoft Exchange Writer'
Writer Id: {76fe1ac4-15f7-4bcd-987e-8e1acb462fb7}
Writer Instance Id: {dabee982-dbe6-4d4f-88be-75bad5e5c83b}
State: [5] Waiting for completion
Last error: No error

Writer name: 'MSDEWriter'
Writer Id: {f8544ac1-0611-4fa5-b04b-f7ee00b03277}
Writer Instance Id: {04978613-5a51-454f-9c34-2ebb4be70514}
State: [1] Stable
Last error: No error

Writer name: 'Registry Writer'
Writer Id: {afbab4a2-367d-4d15-a586-71dbb18f8485}
Writer Instance Id: {edc80bc2-5950-4334-a9a3-5a3b1af09284}
State: [1] Stable
Last error: No error

Writer name: 'Event Log Writer'
Writer Id: {eee8c692-67ed-4250-8d86-390603070d00}
Writer Instance Id: {30302354-ff23-428b-9c84-30860b6bf226}
State: [1] Stable
Last error: No error

Writer name: 'COM+ REGDB Writer'
Writer Id: {542da469-d3e1-473c-9f4f-7847f01fc64f}
Writer Instance Id: {3e149704-f637-419f-90ea-e9e1f7a72c4c}
State: [1] Stable
Last error: No error

Writer name: 'Cluster Service Writer'
Writer Id: {41e12264-35d8-479b-8e5c-9b23d1dad37e}
Writer Instance Id: {c131f870-2b6a-4ae5-99a9-5c97a3e5a5f7}
State: [1] Stable
Last error: No error

Writer name: 'IIS Metabase Writer'
Writer Id: {59b1f0cf-90ef-465f-9609-6ca8b2938366}
Writer Instance Id: {70284a8b-c170-43db-9e15-1c2f04ee3af1}
State: [1] Stable
Last error: No error

Writer name: 'BITS Writer'
Writer Id: {4969d978-be47-48b0-b100-f328f07ac1e0}
Writer Instance Id: {7aecd6c9-9734-4c1d-80ce-8a0e6efd29a0}
State: [1] Stable
Last error: No error

Writer name: 'WMI Writer'
Writer Id: {a6ad56c2-b509-4e6c-bb19-49d8f43532f0}
Writer Instance Id: {c322e2ac-568c-41a8-83e4-37dd3b978004}
State: [1] Stable
Last error: No error


Детали переустановки:
1.Удаление Exchange 2007 с узла, через установка - удаление.

2.Извлечение ноды из кластера, нажатием "Evict node" через контекстное меню в кластерной оснастке, после перевода ноды в offline. После чего кластер забывает про эту ноду.(Предварительно наделал скриншотов - члены группы администраторов, настройки сетевых интерфейсов - пригодятся после переустановки)

3.Установка операционной системы Windows Enterprise с нуля (драйвера, ввод в домен, настройка сети, установка апдейтов с WSUS и т.п.)

4.Добавление с активной ноды в windows кластер вновь установленного узла, при установке указываем учетные данные пользователя от имени которого будет запукаться служба кластера и игнорируем предупреждения о DHCP на сетевых интерфейсах (у нас Teaming - LACP 802.3ad).

5.Установка Exchange на пассивном узле с ролью "Passive Clustered Mailbox Role". Надо сказать, что данные почтовых групп после вывода из кластера я не удалял, а здесь самое время, так как диск для почтовых ящиков подан с SAN то данные на нем остались, но теперь они не нужны - удаляем.

В моем случае по окончании возникла ошибка:

Не могла стартовать служба MSExchangeTransportLogSearch при этом и перезагрузка сервера не помогала, помня прежнее решение этой проблемы добавил в файл host на пассивном узле (на активном она уже была) строчку вида:
127.0.0.1 crl.microsoft.com
после чего служба смогла нормально стартовать.

В итоге получили нормальный список теневых писателей ))):


после чего осталось выполнить скрипт ресинхронизации баз с нуля на пассивную ноду:


####################################
#Shiryaev.DE
#скрипт выполняет перезаливку баз группы хранения с активной на пассивную ноду
#предварительно группе хранения нужно сказать Suspend Storage Group Copy - можно через GUI

$Array_SGs = Get-StorageGroup | select-object server, name, replicated | Sort-Object -Property name
#$Array_SGs = Get-StorageGroup | select-object name | Sort-Object -Property name

"Count of Storage Groups=" + ([string] $Array_SGs.Length)

for($i=0;$i -le $Array_SGs.Length-1;$i++)
{
$SG_NAME = ([string] $Array_SGs[$i].server)+"\"+([string] $Array_SGs[$i].Name)
If ( ([string] $Array_SGs[$i].replicated) -eq "Clustered")
{
"[" + ($i+1) + "]" + "Storage Group name <<" + $SG_NAME + ">> is Clustered"
"reseed processing..."

"---Suspend-StorageGroupCopy <<" + $SG_NAME + ">>"
Suspend-StorageGroupCopy -Identity $SG_NAME -SuspendComment "Suspending CCR to reseed." -Confirm:$false
Start-sleep -s 6
"---Update-StorageGroupCopy <<" + $SG_NAME + ">>"
Update-StorageGroupCopy -Identity $SG_NAME -DeleteExistingFiles -force
Start-sleep -s 6
"---Resume-StorageGroupCopy <<" + $SG_NAME + ">>"
Resume-StorageGroupCopy -Identity $SG_NAME
}
else
{
"[" + ($i+1) + "]" + "Storage Group name" + $SG_NAME + " is NOT Clustered nothing to do."
}
}

После чего все двенадцать групп хранения с общим объемом данных 350Гб получили (Exchange Management Console->Server Configuration->Mailbox->Cluster) "Copy Status" = "Healthy"
Копирование завершилось примерно за 5 часов.
На всё про всё ушло времени с 9-00 по 18-00 с учетом синхронизации, то есть 9 часов.

2 комментария:

  1. не подскажите, по какой причине может поджираться место на Exchange 2007 CCR - база дефрагментируется каждый день online, DPM режет логи - но место постоянно сокращается(
    Есть подозрение на папку cluster, но пока не ясно как с этим бороться =/
    solyeri@gmail.com

    ОтветитьУдалить
  2. Есть удобная утилита windirtree можно ей сделать скриншоты и сравнить куда место утекает.

    ОтветитьУдалить