Slide Slide Slide

El Data Center, preparado ante desastres

Los factores externos al Data Center, y hasta dónde llegar son los planteamientos que debe establecer con su cliente. 

Continuidad del negocio, es la primera de las obligaciones que tiene el Data Center al habilitar el resto de los servicios de los cuales depende la vida diaria de la empresa. Aunque existirán ciertos elementos que salgan de nuestro control, la planeación trata de tocar la mayor cobertura posible en donde siga resultando rentable la disponibilidad, porque como bien comenta la industria “tecnológicamente todo se puede, pero cuál costo es el que se puede afrontar”.

Así que el primer punto para abordar este tema íntimamente relacionado con umbrales (bajo qué circunstancias el Data Center debe seguir operando y la extensión que tengan las mismas), es tener en cuenta cuáles son las variables externas e internas que podrían impedir dicha continuidad. Con el fin de tener un ejercicio rápido de esta idea, si el problema son ataques provenientes de virus que instalan los usuarios por usar memorias flash extraíbles, un Firewall es la respuesta.

La decisión de crear esa redundancia inicia con hacerle caer en conciencia al propio usuario del por qué se necesitan de esos elementos, aparentemente adicionales. José Alberto Llavot, Gerente de Ingeniería de Preventa ITB para Schneider Electric México y Centroamérica explicó que “muchas veces no queda claro lo importante que se vuelve la operación de su Data Center, o que hay dentro del él”.

Una técnica que recomendó para iniciar el camino es contabilizar la importancia en términos que apliquen a cada negocio. Para dar una ejemplificación, propuso la facturación que en La Empresa N, se ejecuta dentro de su centro de datos. Lo que produzca en dicho rubro en lapso de un año, es dividido por los 365 días para indicar en forma práctica cuánto vale el dejar de utilizar los servicios IT. Traducir la caída del servidor en pérdidas monetarias para su cliente, es lo que prende las alarmas sonoras.

Cuando hablamos pertinentemente de continuidad ante factores externos, la planeación es distinta porque se trata de mitigar eventos azarosos, aquellos que en cualquier momento se presentan  y sin previo aviso o bien, fallas humanas de empresas proveedoras que igualmente puedan reducir su operación. La industria cataloga lo anterior en normas como la NMX-J-C-I-489-ANCE-ONNCCE-NYCE-2014.

La NX 489 como se suele conocer, fue aprobada desde el pasado 15 de julio en el Diario Oficial de la Federación, la cual describe cual es la operación para los centros de datos de alto desempeño y sustentables. Dos propiedades que seguramente estará pendiente su cliente cuando toquen el tema de TCO.

Así que cuáles son los parámetros a medir, sobre todo cuando se trata de un DC por crear. Diseño, Construcción y Operación. Si ponemos el caso de Tier IV como Kio Networks, donde controlan inclusive cuáles son las horas en las cuales el aire ambiental es lo suficientemente eficiente para llevarlo a los appliances, podemos decir que efectivamente llevar esos tres parámetros hacia la eficiencia son tecnológicamente posibles; pero el planteamiento va enfocado hacia, ¿son críticamente necesarios para su proyecto actual?

Sembrando el terrero
La construcción y topología del terrero son importantes. Tan es así que su proyecto podría quedar mal parado si por un desatino no consideró que en verano la zona es muy calurosa, sólo porque durante su construcción en diciembre era claramente helado el viento. Parece obvio, pero esa planeación a futuro, hace la diferencia.

No obstante, se recomienda que sitúe el Data Center alejado de una zona sísmica o fangosa donde se considere de bajo riesgo. Lo anterior no impide que la Ciudad de México tenga Centros de Datos pese a estar considerada como una zona sísmica. Visto de forma proactiva, significa integrar elementos para lidiar con las condiciones del lugar donde se requiere la implementación, aspectos que ya nos dan una idea más certera sobre dónde aplicar la redundancia.

José Alberto Llavot de Schneider Electric México y Centroamérica dijo que los primeros riesgos tienen que ver con los elementos energéticos e hidráulicos. Ciertamente, si el centro para empezar no recibe energía en automático falla el resto de los sistemas. La respuesta puede ir desde contratar otra acometida, hasta tener generadores impulsados por gasolina.

Cuando se intentan establecer los problemas de la región o del propio terrero, se tiene por resultado aquellos equipos que deben ser redundantes, siempre y cuando se tenga la certeza que el cliente opera diario. “El resultado no siempre es el mismo, hay quienes pueden dejar de operar por la noche o un par de días. La tendencia plantea que las aplicaciones de cómputo estén disponibles todo el tiempo porque se desdibuja la línea que dividía a las aplicaciones críticas. Percatarse de proyectos no ganados, decisiones no tomadas por no contar con la información pertinente, esa es la importancia de la disponibilidad”, agregó José Alberto Llavot.

Opciones para continuar la operación
La energía es un elemento central. En cuestión de productos, Miguel Angel Monterrosas, Director de Soporte Técnico Tripp Lite México comentó que es posible contar con opciones de 1 KVA a 120 KVA. Así que un UPS puede ser la primera línea de defensa para mantener en pié los servicios – con respecto al suministro energético. La presentación varía en cuestión del espacio disponible, la necesidad del equipo y cuantos minutos (u horas) de autonomía requiera cada caso.

Pero no es el único elemento, también existen Power Distribution Unit (PDU) que funcionan como si se tuviera una barra de contactos en forma vertical. Su ayuda radica en que se coordinan con varios UPS para que si uno de ellos falla, entre en operación un segundo y siga energizando a los equipos. Todo esto en forma prácticamente instantánea. Algunas opciones tienen una propiedad llamada Automatic Transfer Switch (ATS) para lograr este tipo de arreglos autónomos.

Sin embargo, no es el único problema a considerar durante la operación, ya que el hecho de que el especialista no se encuentre para remediar una circunstancia por mínima que sea, puede considerarse igualmente como riesgo. El KVM es una consola de control que permite administrar dispositivos a distancia, aunque éstos tengan un puerto serial. Lo que resulta frecuente para el cliente, es que el especialista realiza visitas periódicas y arregla algún desperfecto encontrado, pero tiene que estar físicamente con los equipos. Con esta opción, es posible que ingrese a las consolas e interactúe con la estructura técnica sin tener que estar frente a los gabinetes.

De hecho, la firma comentó que cuentan con una serie de gabinetes a prueba de temblores gracias a su plataforma móvil. Este elemento permite mantener más seguro el interior para que no importando la carga de trabajo, si se presenta este tipo de fenómenos naturales, no se dañen los discos duro o una desconexión accidental ocurra. Como podrá darse cuenta, cada equipo agrega funcionalidad para balancear un evento inesperado.

Por supuesto, no sólo una caída de la acometida de CFE es parte de los riesgos externos. De igual forma asegurarse que las personas correctas ingresan a las charolas o caminan entre los pasillos, es parte del planteamiento.

Schneider Electric agregó que alrededor de 70 a 80 de las fallas presentadas en la disponibilidad tienen que ver con factores humanos, que van desde presionar un botón por error, hasta una implementación incorrecta.

Este es uno de los motivos por el cual la seguridad física tiene el mismo nivel de importancia, la cual no queda concreta con sólo echar el cerrojo. En ese sentido, expresó que debe considerar un plan de registro que administre un control de acceso, cámaras de videovigilancia para determinar si una falla fue producto de algún error interno, así como detectores de incendios. De acuerdo con la firma, el monitoreo del sistema eléctrico y aire acondicionado es parte de ese sistema hidráulico que debe estar constantemente monitoreado y en funcionamiento.

Así que volvemos a la pregunta central sobre la redundancia y qué debería de respaldar con equipo duplicado. De acuerdo a la experiencia de José Alberto Llavot, adicional a lo que se considere, inicia con contemplar al suministro energético, que puede ser en componentes específicos o para módulos completos.

A continuación, considerar fallas de aire acondicionado (recordando que el calor es el enemigo mortal de los semiconductores), y mantener en operación el monitoreo que apunte lo más cercano al Data Center como podría ser CCTV en pasillos y el ingreso físico a la instalación. Estas recomendaciones variarán con respecto al nivel de Tier que busque poner en pie y la propia zona geográfica donde quedará asentado el proyecto final. Lo que debe tener en consideración es la disponibilidad medida en cuántos minutos al año podría fallar el Data Center, regularmente representado en porcentaje.

Monterrosas agregaría que la redundancia tiene que ver con la principal actividad que realice el cliente. De esta forma, un operador telefónico tiene repetidores en sus celdas para, en caso de que una infraestructura falle, entre la secundaria. El componente de almacenamiento será lo más importante a mantener habilitado si se trata de una empresa de hosting; es decir, aunque todas las funciones son importantes, ante una situación inesperada debe de poner en la balanza cuál es el último componente que debe mantenerse en pie.

Miguel Angel Monterrosas de Tripp Lite dijo que parte de sus herramientas para el canal es la capacitación para que conozca las variables en sus términos más completos cuando se desea actualizar o formar un centro de datos. Agregó que no existe hasta el momento una guía que aplique a todo tipo de situación; sin embargo, presentan los factores más importantes como es temperatura y humedad para que puedan resolver los dilemas a los cuales se podrían enfrentar.

Dicha herramienta no tiene costo para su canal asociado, por lo que puede resultar de gran apoyo para actualizar su base de conocimiento y saber más sobre las cuestiones de escalamiento de un proyecto con forme las necesidades del cliente lo soliciten.

Lee más
ASUS Laptops
ASUS presenta laptops con procesadores Intel de 11ª generación