После обновления EMC Cluster Enabler 3.0.83.0 до версии 3.1.0.0 на настроенном SQL кластере(Active/Active) с настроенной зеркальной репликацией на хранилищах перестал работать автоматическое переключение (разворачивание) зеркальной репликации между массивами хранения EMC CX4-120, при Failover. Устанавливался EMC Cluster Enabler 3.1.0.0 устанавливался без удаления предыдущего, при этом после установки нода кластера перезагружалась. Причем дисковый ресурс вообще не поднимается, а также дискам не были назначены буквы и такое ощущение что диски в offline, по крайней мере это следовало из Server Manager → Disk Manager.
Хотя при этом EMC Cluster Enabler Manager показывал, что диск с буквой назначен.
Ещё в лог выпадали ошибки вида:
Cluster resource 'EMC_SQL Server (CLUSTER02SQL2)' in clustered service or application 'SQL Server (CLUSTER02SQL2)' failed.
-------------------------------------------------------------------------
Log Name: Application
Source: EMC Cluster Enabler
Event ID: 5
Task Category: None
Level: Error
Keywords: Classic
User: SYSTEM
Computer: SQL-NODE-01.
Description:
Call to [EvaluateFailoverPolicies] failed. RC=[0×80004005].
Event Xml:
5
2
0
0x80000000000000
6461
Application
Call to [EvaluateFailoverPolicies] failed. RC=[0x80004005].
53514C5F5365727665725F5F434C5553544552303253514C325F
Log Name: Application
Source: EMC Cluster Enabler
Event ID: 5
Task Category: None
Level: Error
Keywords: Classic
User: SYSTEM
Computer: SQL-NODE-01.
Description:
Group [SQL_Server_CLUSTER02SQL2_] failed to come online.
Event Xml:
5
2
0
0x80000000000000
6462
Application
SQL-NODE-01.
Group [SQL_Server__CLUSTER02SQL2_] failed to come online.
53514C5F5365727665725F5F434C5553544552303253514C325F
Log Name: Application
Source: EMC Cluster Enabler
Event ID: 3
Task Category: None
Level: Error
Keywords: Classic
User: SYSTEM
Computer: SQL-NODE-01.
Description:
Call to [CEFailOverLogic::WriteEnableMirrorGroup] failed for cluster resource [EMC_SQL Server (CLUSTER02SQL2)]. RC=[0×80004005].
Event Xml:
3
2
0
0x80000000000000
6463
Application
SQL-NODE-01.
Call to [CEFailOverLogic::WriteEnableMirrorGroup] failed for cluster resource [EMC_SQL Server (CLUSTER02SQL2)]. RC=[0x80004005].
454D435F53514C205365727665722028434C5553544552303253514C3229
Перевел кластерные ресурсы на ту кластерную ноду, где были диски.
Разорвал вручную репликацию между системами хранения
cluster enabler продолжал думать…
пробовал различные варианты - reconfigure CE на диск, Deconfigure - ничего не помогало
Пустил вручную синхронизацию между системами хранения на необходимые луны (т.е. те, которые были кластерными дисками). После этого - 2-й диск увиделся на ноде - владельце диска, в EMC Cluster Enabler Manager в контекстном меню выполнил Configure - на корне - после чего создалась группа консистентности автоматически и 2-й кластерный диск (2-го SQL кластера) поднялся и сам SQL-cluster 2-й тоже поднялся и стал работать.
Первый же кластер никак не хотел подниматься - диск не брал букву. Сделал на 1-м диске Deconfigure CE и перезагрузил ноду владельца. Кроме того в EMC Cluster Enabler Manager группа 1-го SQL кластера не хотела выполнять операцию «Deconfigure CE» выпадала ошибка. После перезагрузки оба диска не взяли буквы. Поскольку перегружал ноду - все ресурсы у бежали на пассивную ноду, но там не поднялись. Перегрузил и её что бы вернуться к ноде с которой работал до перезагрузки вообще. После перезагрузки поднялся 2-й диск - это правильно, поскольку не было ни одной группы консистентности, связанной с Cluster Enabler. Перезагрузка не помогла с 1-м диском, он таки не брал букву и оставался без буквенным - удалил группу «SQL Server (CLUSTER02SQL1)» через EMC Cluster Enabler Manager, после чего 1-й диск сразу поднялся и ему присвоилась нормально группа, при этом 1-й диск удалился тоже в EMC Cluster Enabler Manager-е. Сделал Modify на группе «SQL Server (CLUSTER02SQL1)» (на самом деле она удалилась как группа для которой включен Cluster Enabler, а не из кластера вообще).
На освобожденном дисковом ресурсе (1-й диск) через оснастку Failover Cluster Management (Windows 2008 не R2) через контекстное меню на диске «More Actions…» → «Move this resource to another service or application» и в открывшемся окне выбрал 1-й кластер SQL Server-а. После этих манипуляций «SQL Server (CLUSTER02SQL1)» - кластерный ресурс (1-й кластер SQL Server на Active/Active кластере) запустился полностью. Осталось только теперь добавить эту группу обратно в Cluster Enabler чтобы перебегало хранилище и разворачиывалась репликация при выключении или падении ноды. Замечу что после этого диск заново появился в группе «SQL Server (CLUSTER02SQL1)» в EMC Cluster Enabler Manager.
Для преобразования кластерных групп в Cluster Enabled группы идем в EMC Cluster Enabler Manager и на корне там где у нас виндовый кластер Cluster-02 правой кнопкой выбираем меню «Configure CE Cluster» → Configure → Здесь открывается список с нодами кластера жмем Next →
После чего были автоматически созданы группы консистентности для обоих виртуальных SQL Server-ов (кластерных ресурсов или что то же самое SQL кластеров). И для обеих групп: «SQL Server (CLUSTER02SQL1)» и «SQL Server (CLUSTER02SQL2)» Cluster Enabler стал включенным.
При проверке диск не перебежал в ручном режиме - не назначилась буква - пустил ноду - на которую диск не перебежал в перезагрузку. После этого всё заработало - проверял перезагрузкой активной ноды. Единственный момент только упустил в EMC Cluster Enabler Manager необходимо было выставить в свойствах групп Failover Behavior: Automatic Failover вместо Restrict Group movement.