понедельник, 31 мая 2010 г.

Обновление EMC Cluster Enabler с версии 3.0.81.0 до версии 3.1.0.0

После обновления EMC Cluster Enabler 3.0.83.0 до версии 3.1.0.0 на настроенном SQL кластере(Active/Active) с настроенной зеркальной репликацией на хранилищах перестал работать автоматическое переключение (разворачивание) зеркальной репликации между массивами хранения EMC CX4-120, при Failover. Устанавливался EMC Cluster Enabler 3.1.0.0 устанавливался без удаления предыдущего, при этом после установки нода кластера перезагружалась. Причем дисковый ресурс вообще не поднимается, а также дискам не были назначены буквы и такое ощущение что диски в offline, по крайней мере это следовало из Server Manager → Disk Manager.

Хотя при этом EMC Cluster Enabler Manager показывал, что диск с буквой назначен.

Ещё в лог выпадали ошибки вида:

Cluster resource 'EMC_SQL Server (CLUSTER02SQL2)' in clustered service or application 'SQL Server (CLUSTER02SQL2)' failed.

-------------------------------------------------------------------------

Log Name: Application

Source: EMC Cluster Enabler

Event ID: 5

Task Category: None

Level: Error

Keywords: Classic

User: SYSTEM

Computer: SQL-NODE-01.

Description:

Call to [EvaluateFailoverPolicies] failed. RC=[0×80004005].

Event Xml:

http://schemas.microsoft.com/win/2004/08/events/event»>

  
  5
  2
  0
  0x80000000000000
  6461
  Application
  Call to [EvaluateFailoverPolicies] failed. RC=[0x80004005].
  53514C5F5365727665725F5F434C5553544552303253514C325F


Log Name: Application

Source: EMC Cluster Enabler

Event ID: 5

Task Category: None

Level: Error

Keywords: Classic

User: SYSTEM

Computer: SQL-NODE-01.

Description:

Group [SQL_Server_CLUSTER02SQL2_] failed to come online.

Event Xml:

http://schemas.microsoft.com/win/2004/08/events/event»>

  5
  2
  0
  0x80000000000000
  6462
  Application
  SQL-NODE-01.
  
  Group [SQL_Server__CLUSTER02SQL2_] failed to come online.
  53514C5F5365727665725F5F434C5553544552303253514C325F


Log Name: Application

Source: EMC Cluster Enabler

Event ID: 3

Task Category: None

Level: Error

Keywords: Classic

User: SYSTEM

Computer: SQL-NODE-01.

Description:

Call to [CEFailOverLogic::WriteEnableMirrorGroup] failed for cluster resource [EMC_SQL Server (CLUSTER02SQL2)]. RC=[0×80004005].

Event Xml:

http://schemas.microsoft.com/win/2004/08/events/event»>

  3
  2
  0
  0x80000000000000
  6463
  Application
  SQL-NODE-01.
  
  Call to [CEFailOverLogic::WriteEnableMirrorGroup] failed for cluster resource [EMC_SQL Server (CLUSTER02SQL2)]. RC=[0x80004005].
  454D435F53514C205365727665722028434C5553544552303253514C3229


Перевел кластерные ресурсы на ту кластерную ноду, где были диски.

Разорвал вручную репликацию между системами хранения

cluster enabler продолжал думать…

пробовал различные варианты - reconfigure CE на диск, Deconfigure - ничего не помогало

Пустил вручную синхронизацию между системами хранения на необходимые луны (т.е. те, которые были кластерными дисками). После этого - 2-й диск увиделся на ноде - владельце диска, в EMC Cluster Enabler Manager в контекстном меню выполнил Configure - на корне - после чего создалась группа консистентности автоматически и 2-й кластерный диск (2-го SQL кластера) поднялся и сам SQL-cluster 2-й тоже поднялся и стал работать.

Первый же кластер никак не хотел подниматься - диск не брал букву. Сделал на 1-м диске Deconfigure CE и перезагрузил ноду владельца. Кроме того в EMC Cluster Enabler Manager группа 1-го SQL кластера не хотела выполнять операцию «Deconfigure CE» выпадала ошибка. После перезагрузки оба диска не взяли буквы. Поскольку перегружал ноду - все ресурсы у бежали на пассивную ноду, но там не поднялись. Перегрузил и её что бы вернуться к ноде с которой работал до перезагрузки вообще. После перезагрузки поднялся 2-й диск - это правильно, поскольку не было ни одной группы консистентности, связанной с Cluster Enabler. Перезагрузка не помогла с 1-м диском, он таки не брал букву и оставался без буквенным - удалил группу «SQL Server (CLUSTER02SQL1)» через EMC Cluster Enabler Manager, после чего 1-й диск сразу поднялся и ему присвоилась нормально группа, при этом 1-й диск удалился тоже в EMC Cluster Enabler Manager-е. Сделал Modify на группе «SQL Server (CLUSTER02SQL1)» (на самом деле она удалилась как группа для которой включен Cluster Enabler, а не из кластера вообще).

На освобожденном дисковом ресурсе (1-й диск) через оснастку Failover Cluster Management (Windows 2008 не R2) через контекстное меню на диске «More Actions…» → «Move this resource to another service or application» и в открывшемся окне выбрал 1-й кластер SQL Server-а. После этих манипуляций «SQL Server (CLUSTER02SQL1)» - кластерный ресурс (1-й кластер SQL Server на Active/Active кластере) запустился полностью. Осталось только теперь добавить эту группу обратно в Cluster Enabler чтобы перебегало хранилище и разворачиывалась репликация при выключении или падении ноды. Замечу что после этого диск заново появился в группе «SQL Server (CLUSTER02SQL1)» в EMC Cluster Enabler Manager.


Для преобразования кластерных групп в Cluster Enabled группы идем в EMC Cluster Enabler Manager и на корне там где у нас виндовый кластер Cluster-02 правой кнопкой выбираем меню «Configure CE Cluster» → Configure → Здесь открывается список с нодами кластера жмем Next →

После чего были автоматически созданы группы консистентности для обоих виртуальных SQL Server-ов (кластерных ресурсов или что то же самое SQL кластеров). И для обеих групп: «SQL Server (CLUSTER02SQL1)» и «SQL Server (CLUSTER02SQL2)» Cluster Enabler стал включенным.


При проверке диск не перебежал в ручном режиме - не назначилась буква - пустил ноду - на которую диск не перебежал в перезагрузку. После этого всё заработало - проверял перезагрузкой активной ноды. Единственный момент только упустил в EMC Cluster Enabler Manager необходимо было выставить в свойствах групп Failover Behavior: Automatic Failover вместо Restrict Group movement.


Комментариев нет:

Отправить комментарий