Que es un failover o conmutación por error?

image

La conmutación por error, o failover , es un modo de funcionamiento de respaldo en el que las funciones de un componente de sistema (tal como un procesador, servidor, red o base de datos, por ejemplo) son asumidos por componentes del sistema secundario cuando el componente principal no está disponible ya sea debido a una falla o por el tiempo de inactividad programado.

Se utiliza para hacer los sistemas más tolerantes a fallos, y suele ser una parte integral de los sistemas de misión crítica que deben estar constantemente disponibles. El procedimiento implica descargar tareas de forma automática a un componente del sistema en modo de espera para que el procedimiento sea tan transparente como sea posible para el usuario final.

La conmutación por error se aplica a cualquier aspecto de un sistema: dentro de un equipo de cómputo personal, por ejemplo, el failover podría ser un mecanismo para proteger contra un fallo de procesador; dentro de una red, se puede aplicar a cualquier componente de la red o sistema de componentes, tales como una conexión ruta de acceso, dispositivo de almacenamiento o servidor Web.

Originalmente, los datos almacenados se conectan a los servidores en configuraciones muy básicas: ya sea punto a punto o de acoplamiento cruzado (cross-coupled). En tal ambiente, la falla (o incluso el mantenimiento) de un solo servidor frecuentemente provocan que el acceso a los datos sea imposible para un gran número de usuarios hasta que el servidor esté de nuevo en línea.

Desarrollos más recientes, como la [red de área de almacenamiento (SAN), hacen posible la conectividad de cualquier elemento a cualquier otro entre servidores y sistemas de almacenamiento de datos. En general, las redes de almacenamiento utilizan muchos caminos –cada uno compuesto por juegos completos de todos los elementos que intervienen– entre el servidor y el sistema. Un camino fallido puede ser resultado de la falla de cualquier componente individual de un camino. Rutas de conexión múltiples, cada uno con componentes redundantes, se utilizan para ayudar a asegurar que la conexión sigue siendo viable incluso si uno (o más) caminos fallan. La capacidad de recuperación automática significa que las funciones normales pueden mantenerse a pesar de las interrupciones inevitables causadas ​​por problemas con el equipo.

En Costech Solutions tenemos experiencia configurando servicios de alta demanda para nuestros clientes. Contactenos :slight_smile: