El historial clínico del centro de datos

 

En la actualidad, la información es uno de los bienes más preciados; su generación, recopilación, almacenamiento, distribución, utilización y calidad puede determinar el éxito o fracaso de un producto, negocio e incluso de una empresa.

Al tomar como ejemplo una práctica médica mundialmente empleada y al hacer salvedad de sus respectivas diferencias, es posible afirmar que la historia clínica de las personas es un conjunto de documentos que recopila información médica a lo largo de sus vidas; toma en cuenta antecedentes personales y familiares, patologías, vida laboral y social, así como cualquier otro dato que los médicos consideren relevante y que pueda servir para determinar causas de una condición médica, aportar información durante una intervención de emergencia e incluso poder prevenir un futuro padecimiento. A partir de este ejemplo, surge la pregunta “¿Es posible aplicar esta práctica médica en el centro de datos?”. La respuesta es: sí, es posible.

Los equipos que se instalan en un centro de datos para brindar soporte operativo a los equipos críticos de TI están formados por componentes que se rigen por una línea de producción y ensamblaje controlada. En ese momento nace cualquier equipo que formará parte de la infraestructura del centro de datos y es importante iniciar su seguimiento desde este punto:

– Documento de ensamble, pruebas y control de calidad. Es el documento que posee un equipo cuando sale de la línea de producción, en donde quedan plasmados las personas y fechas en que se realizaron las verificaciones del equipo y su respectivo número de serie que lo define de forma única y que permite la identificación de cada uno de sus componentes internos.

– Documento de witness test o prueba en fábrica. Según los requerimientos de cada equipo, se pueden realizar pruebas en fábrica para corroborar su adecuado funcionamiento previo al envío.

– Documento de prueba en las instalaciones locales. En algunas ocasiones es requerido que el equipo se pruebe en las instalaciones locales previo a la entrega.

– Documento de instalación. Es importante asegurarse de que el proveedor instaló el equipo de acuerdo con las recomendaciones del fabricante.

– Documento de prueba de post-instalación. Es importante asegurarse que el equipo opera correctamente luego de su instalación y se utiliza para las configuraciones básicas del equipo.

– Documento de prueba individual. Son las pruebas aplicadas al equipo de forma aislada para corroborar su funcionalidad. Sirven para ajustar los parámetros a los definidos en el diseño.

– Documento de prueba de sistema. Son las pruebas que se realizan al sistema de equipos para corroborar la funcionalidad de un sistema de equipos.

– Documento de prueba integral. Son las pruebas que se realizan a toda la infraestructura del centro de datos para verificar la funcionabilidad general.

– Documento de Start-up. Es el documento que indica que el equipo ha sido arrancado y menciona los parámetros configurados.

– Manual de instalación, operación y mantenimiento. Se requiere contar con todos los manuales de los equipos, tanto los que son entregados por el fabricante como los brindados por el proveedor y los creados específicamente para el cliente.

– Lista de repuesto. Se requiere contar con la lista de repuestos por cada equipo, con su respectiva información de cambio.

– Registro de intervenciones. Se debe contar con un registro de todas las intervenciones que se le han realizado al equipo (preventivas, correctivas, predictivas o de petición especial), con sus respectivas causas y soluciones.

La lista anterior muestra algunos de los documentos necesarios por cada uno de los equipos que conforman la infraestructura del centro de datos. Dicha lista no es limitada, pues admite cualquier otro documento o información que pueda ser de utilidad para determinar las condiciones de los equipos.

Al pensar en cómo almacenar, gestionar, poner a disposición, utilizar y actualizar toda la información que se tiene o que se estará recopilando, lo primero que debe tenerse en cuenta es que la información esté disponible para todas las personas y en todo momento. Esto implica manejar la información en medios digitales redundantes o, en última instancia, en un medio físico.

Actualmente, existe en el mercado múltiples opciones de sistemas de gestión de documentos con diferentes opciones de almacenamiento y acceso a la información. Dichos sistemas pueden instalarse y almacenar la información en servidores físicos, virtuales e incluso en la nube. Su acceso puede ser desde estaciones fijas o de dispositivos móviles. Asimismo, algunos de estos sistemas tienen opciones propias de redundancia y respaldo de la información y, en caso de no contarse con esta funcionalidad, deberá realizarse con otros sistemas o equipamientos.

Si bien es cierto que las opciones de manejo de información en forma digital son cada vez mayores y abren un mundo de posibilidades, existe información que se maneja mejor en su versión física, tales como los planos, diagramas eléctricos, manuales de mantenimiento, entre otros documentos. Lo anterior provoca que sea necesario tener en las instalaciones una especie de biblioteca o planoteca para el manejo de este tipo de información.

La selección de la forma en que se gestionará la información dependerá del nivel de madurez del centro de datos y de los recursos con los que cuenta para su adquisición, utilización y mantención, independientemente de la metodología, debe asegurarse que el personal esté debidamente capacitado para acceder, utilizar, mantener y actualizar dicha información.

La información con la que cuente el centro de datos permitirá al personal poder tomar acciones predictivas, preventivas, correctivas y de análisis de fallos o averías, para poder mantener la continuidad operativa y el buen estado de los equipos y sistemas. “La información por sí sola no tiene valor, es su análisis y beneficios lo que le otorga ese valor” .

Retomando la comparativa de la historia clínica, cuando una persona acude al médico, es usual que se le pregunte si dispone de historia clínica en dicho centro de atención para solicitarlo y, en caso de no poseerlo, se le genera uno. Esto es una práctica cotidiana en los centros médicos, porque la historia clínica permite a los médicos ser más exactos y ágiles en sus diagnósticos y no tener que esperar nuevos análisis o exámenes clínicos. Así mismo, cuando se asiste de emergencia a un centro médico, lo usual es pasar por el “triage”, para que el personal médico pueda calificar y determinar qué tan urgente es el padecimiento, así como tomar nota de la condición actual y de algunas alergias o reacciones adversas a algún medicamento.

En el caso de los centro de datos, es necesario contar con algo similar a la historia clínica de las personas, para poder detectar de forma acertada y ágil la alarma o falla que presenta el equipo o sistema, basándose en los reportes anteriores de intervenciones de los equipos, alarmas presentadas, informes de mantenimiento, entre otros. Cuando se presentan varias alarmas dentro del centro de datos, se realiza un proceso similar al triage para determinar qué alarma se intervendrá en primer lugar, según el impacto que esta pueda tener en la continuidad de la operación.

Un ejemplo de la utilidad de la historia clínica en el centro de datos está presente en el tema de las baterías de la UPS, explicado a continuación:

– Al momento de poner en marcha el UPS, se nos indicó que la autonomía de las baterías era de 10 minutos a plena carga.
– Las baterías tienen un periodo de vida de 3 años.
– Se nos indicó que la temperatura de la sala de UPS debería mantenerse dentro de los 25°C +/- 2°C para no dañar las baterías.
– Las pruebas de la UPS previas a la puesta en marcha indicaron que todo funcionada correctamente.

Las indicaciones dadas para las UPS y sus baterías llevan a tomar las siguientes medidas preventivas:

– Se debe monitorear la autonomía de la UPS teniendo como punto de referencia los 10 minutos a plena carga. Si la autonomía no llegara a valores cercanos a los 10 minutos y aún no hemos alcanzado el 100% de la capacidad, puede ser indicativo de que hay un problema con las baterías.
– Las baterías tienen una vigencia de 3 años, por lo tanto, es importante programar la renovación de las mismas, meses antes de cumplir los 3 años.
– Se debe monitorear la temperatura de la sala de UPS, para garantizar que la temperatura no se salga de los rangos establecidos y, si se diera el caso, sería necesario un chequeo post-situación para verificar las condiciones de las baterías.
– El equipo operaba correctamente antes de la puesta en marcha y cualquier falla posterior podría deberse más a condiciones de operación que a problemas de fábrica.

En el caso de presentarse una situación con la autonomía de las UPS, existen algunos puntos de partida para determinar cuáles pudieron ser las causas. En el caso de que la causa sea que las baterías se degradaron por las malas condiciones eléctricas que hacían que las UPS usaran las baterías casi de forma constante, impidiendo que las baterías se cargaran completa y correctamente como lo pedía el manual del fabricante, debe hacerse el ajuste al historial clínico y tomar medidas tales como:

– Las baterías deben completar su ciclo de carga y descarga para garantizar su correcto funcionamiento.
– Durante el mantenimiento preventivo se debe verificar que las baterías se han cargado y descargado correctamente.
– Durante las situaciones de mala condición eléctrica se debe encender los generadores, para evitar la carga y descarga innecesaria de las baterías.

El contar con información inicial de la infraestructura del centro de datos es un buen parámetro de referencia para las condiciones futuras. Así mismo, estas condiciones deben registrarse para minimizar sus impactos o prevenir que ocurran nuevamente.

Por otra parte, la existencia de toda esta información, conlleva la necesidad de un personal capacitado que sepa interpretarla. El personal del centro de datos debe ser capaz de identificar una alarma y categorizarla correctamente como lo hace el personal médico con el triage de los pacientes. Una mala interpretación de las condiciones de la infraestructura del centro de datos podría causar una pérdida de la continuidad operativa, si no se sabe leer correctamente las alarmas. Un caso muy común son las alarmas de corto ciclaje de las unidades de aire acondicionado del tipo expansión directa que indican una condición de operación inadecuada y que, de no corregirse a la brevedad, pueden causar daños al compresor del equipo y generar largos periodos de parada por mantenimiento correctivos.

La información de las alarmas, sus orígenes y consecuencias deben ser parte de la historia clínica, de esta manera, cuando el personal observe la alarma, puede darle la adecuada categorización y, por ende, reducir la cantidad de atenciones correctivas e incluso evitar una pérdida de continuidad de operación. Esto evidencia que la información es de suma importancia para operar correctamente un centro de datos y que, al mismo tiempo, las capacidades del personal para utilizar dicha información deben ser óptimas, punto que será tema de un próximo documento.

La historia clínica del centro de datos se empieza a conformar desde el momento en que se planea colocar un nuevo equipo en las instalaciones. Cualquier información, por más irrelevante que parezca, puede evitar una pérdida de la continuidad operativa. Por lo tanto, no puede dejarse nada de lado y siempre debe recordarse que “Lo importante no es la información, sino lo que se hace con ella”.

Por: Víctor Fernández – Critical Facilities Management Consultant – INGENIUM
[email protected]