O que é a redundância de servidores?


Redundância de servidor é a prática que consiste em utilizar ferramentas, tais como servidores duplicados e componentes associados, no seio de uma infraestrutura de TI, de forma a assegurar a disponibilidade contínua do serviço.

Um princípio fundamental é a eliminação de pontos únicos de falha, tanto no local como na cloud pública. Suponha que um servidor primário funcione mal devido a problemas de hardware, falhas de software ou outros problemas; um servidor secundário e redundante está pronto para assumir imediatamente sua carga de trabalho. O mesmo se aplica aos componentes de um servidor.

disaster recovery

Trata-se de um processo de transferência que deve ser transparente, permitindo que as aplicações, os websites e os serviços críticos permaneçam online e acessíveis aos utilizadores, evitando assim tempos de interrupção dispendiosos e mantendo a continuidade do negócio mesmo na eventualidade de problemas técnicos inesperados.

Além disso, a redundância de servidores envolve a criação de uma arquitetura de sistema resiliente onde os elementos críticos são duplicados. Em ambientes mais robustos, a redundância pode estender-se a datacenters inteiros localizados em diferentes regiões geográficas, de modo a protegê-los contra desastres no âmbito do site.

Porque é que a redundância de servidores é importante?

A redundância dos servidores é de extrema importância porque resolve diretamente a inevitabilidade de falhas do sistema e a necessidade de recuperação de desastres , visando impedi-los de causar interrupções de serviço. Em qualquer ambiente de TI complexo, os componentes de hardware podem funcionar incorretamente, o software pode falhar, as redes podem falhar e a alimentação pode ser interrompida.

Sem redundância, uma falha deste tipo num servidor primário ou nos componentes críticos do mesmo pode causar um tempo de interrupção imediato das aplicações ou serviços que aloja. Esse tempo de inatividade interrompe o acesso do usuário e efetivamente pára os processos que dependem desse servidor.

Além da manutenção da continuidade operacional, a importância da redundância do servidor estende-se a considerações empresariais significativas.

As interrupções do serviço traduzem-se diretamente em perdas tangíveis, incluindo a perda de receitas por interrupção de vendas ou transações, diminuição da produtividade na medida em que os funcionários são incapazes de trabalhar e potenciais danos na integridade dos dados durante falhas não controladas.

Além disso, os períodos de interrupção frequentes ou prolongados corroem a confiança dos clientes e prejudicam a reputação da marca, levando potencialmente os utilizadores a optarem por concorrentes mais fiáveis. Para muitas organizações, em particular em sectores como as finanças e a saúde, a existência de requisitos regulamentares rigorosos ou acordos de nível de serviço (SLA) exigem elevados níveis de disponibilidade, tornando a redundância não só benéfica, como também frequentemente obrigatória. Investir na redundância é, portanto, uma estratégia crucial para mitigar o risco financeiro, proteger a reputação, garantir o cumprimento e garantir uma experiência de utilizador confiável.

Tipos de servidores redundantes

A redundância dos servidores não é uma configuração única, mas sim uma estratégia aplicada de várias maneiras, dependendo das necessidades específicas, do servidor bare metal em uso, do orçamento e da criticidade dos sistemas envolvidos.

São utilizadas diferentes abordagens e tecnologias para duplicar as funções do servidor, garantindo que se um componente ou servidor falhar, outro pode substituir o servidor.

Servidores redundantes de domínio, front-end e validação

Determinadas funções dos servidores são fundamentais para o acesso do utilizador e para as operações essenciais da rede, tornando a redundância um aspeto crucial. Por exemplo, os servidores Domínio, tais como Controladores de Domínio (DCs) em ambientes Windows ou servidores DNS, processam a autenticação de utilizadores, as permissões de acesso e a resolução de nomes de rede.
 

A redundância de DCs ou servidores DNS, muitas vezes através da partilha de vários servidores ativos com dados replicados, permite aos utilizadores continuar a aceder e a localizar recursos mesmo em caso de falha de um servidor. Da mesma forma, os servidores front-end, tais como servidores web que processam ligações iniciais de utilizadores ou gateways de aplicações, são frequentemente tornados redundantes utilizando técnicas como o balanceamento de carga em vários servidores idênticos.
 

Em caso de falha de um dos seus servidores web, o tráfego é automaticamente reencaminhado para os outros servidores, assegurando assim um acesso contínuo. Validação Os servidores, responsáveis por tarefas como a verificação de tokens de segurança ou a autenticação de pedidos de API, também requerem redundância.

Servidores Replicados

A replicação é uma técnica comum utilizada para assegurar a redundância dos servidores, em particular no caso de aplicações com utilização intensiva de dados como as bases de dados ou o armazenamento cloud. Implica a criação e sincronização contínua de uma ou mais cópias (réplicas) dos dados, das configurações de um servidor primário, ou até mesmo de todo o seu estado operacional em servidores secundários.
 

Isto garante a disponibilidade permanente de uma cópia atualizada ou quase atualizada do sistema. Se o servidor primário falhar, um servidor replicado pode ser promovido para assumir as suas funções, geralmente com uma perda mínima de dados. A replicação pode ser síncrona, em que os dados são gravados em simultâneo na primária e na réplica, garantindo zero perdas de dados e potencialmente afetando o desempenho ou o desempenho assíncrono.

Servidores de Recuperação de Desastre

Os servidores de Disaster Recovery (DR) representam uma aplicação específica da redundância, centrando-se na continuidade do negócio face a interrupções em larga escala que podem afetar todo um centro de dados primário ou localização geográfica.
 

Ao contrário da redundância local, que trata de falhas de componentes ou de um único servidor, a DR envolve a manutenção de servidores de backup, sistemas e infraestrutura em um local separado, muitas vezes geograficamente distante.
 

Estes servidores de recuperação de desastres foram concebidos para controlar operações críticas se o site principal ficar indisponível devido a desastres naturais, falhas de energia prolongadas ou incidentes de segurança graves.

Como implementar a redundância de servidores na sua infraestrutura

A implementação eficaz da redundância de servidores requer um planeamento e uma execução cuidadosos, adaptados às suas necessidades operacionais específicas e ao seu ambiente técnico. Geralmente, o processo começa com uma avaliação minuciosa para identificar as aplicações, os serviços e os dados mais críticos e, portanto, que requerem redundância.

Trata-se de definir objetivos claros, como o tempo de inatividade máximo tolerável (Recovery Time Objetive, ou RTO) e a quantidade aceitável de perda de dados (Recovery Point Objetive, ou RPO).

Com base nestes requisitos e considerações orçamentais, pode selecionar a estratégia de redundância adequada, quer se trate de agrupamento em cluster após falha (ativo/passivo ou ativo/ativo), equilíbrio de carga entre vários servidores, replicação de dados, implementação de locais de recuperação de desastres geograficamente separados, ou uma combinação dos mesmos.

As plataformas de cloud computing oferecem frequentemente opções de redundância incorporadas, tais como zonas de disponibilidade ou serviços de bases de dados redundantes geridas, que podem simplificar a implementação. A fase principal de implementação consiste em configurar servidores, armazenamento, ligações de rede e os mecanismos de redundância escolhidos, incluindo a implementação de sistemas de monitorização para detetar falhas e a implementação de processos automatizados, tais como IP Failover, para gerir a transição.

O que é o IP Failover na redundância do servidor?

O IP Failover é um mecanismo crítico utilizado em muitas configurações de redundância de servidores e de cloud privada virtual, de modo a assegurar uma transição sem falhas de um servidor primário para um servidor redundante de reserva, sem que seja necessário efetuar alterações no lado do cliente.

Essencialmente, é o processo de reatribuir automaticamente um endereço IP associado a um serviço, do servidor que falhou para o servidor de backup que está a assumir as suas funções.

Geralmente, os serviços são acedidos através de um endereço IP específico; se esse endereço ficar incontactável devido a uma falha no servidor que o aloja, os clientes perdem a conectividade. O IP Failover resolve esta situação assegurando que o endereço IP do serviço fica ativo e apenas é alojado numa máquina diferente.

Isto é frequentemente conseguido através de um endereço IP "flutuante" ou "virtual" que não está permanentemente ligado à interface de rede de um único servidor. Os sistemas de monitorização, que fazem frequentemente parte de um cluster de alta disponibilidade ou de uma configuração de repartidor de carga, detetam quando o servidor primário deixa de responder.

Após detetar uma falha, o sistema ativa automaticamente um processo para atribuir este endereço IP flutuante à interface de rede do servidor de backup designado. Dispositivos de rede aprendem rapidamente (geralmente através de protocolos como ARP) que o endereço IP agora corresponde ao endereço MAC de hardware do servidor de backup, redirecionando o tráfego de acordo com isso.

O que mais deve ser redundado para um desempenho ideal?

Conseguir uma verdadeira resiliência e um desempenho ideal requer olhar para além dos próprios servidores. Vários outros componentes da infraestrutura são pontos críticos de falha, mesmo quando não são arquitetados com redundância.

Garantir que estes elementos também estão duplicados ou possuem capacidades de failover é essencial para um sistema robusto e altamente disponível.

  • Backups Ofereça redundância de dados, permitindo a recuperação de corrupções, eliminações acidentais, ataques ransomware ou falhas catastróficas, mesmo quando os sistemas de redundância em tempo real podem também estar comprometidos.
     
  • Discos: Evite interrupções do servidor e perdas de dados resultantes de falhas da unidade única, graças à utilização de tecnologias como RAID (Redundant Array of Independent Disks), que mantém um acesso aos dados e um desempenho do sistema contínuos.
     
  • Fontes de alimentação: Assegure o funcionamento contínuo do servidor impedindo um encerramento abrupto se uma única fonte de alimentação (PSU) falhar dentro do chassis do servidor.
     
  • Ligação Internet: Mantenha o acesso externo à rede e a disponibilidade do serviço para os utilizadores, utilizando vários fornecedores de serviços Internet (ISPs) e caminhos de rede diversificados, evitando falhas do fornecedor ou cortes de cabos.

Melhores práticas para conseguir redundância de servidor

A eficácia na redundância do servidor começa pelo planeamento exaustivo e por um design centrado na eliminação de pontos únicos de falha em todo o seu parque de infraestruturas.

Defina claramente os seus Objetivos de tempo de recuperação (RTO) e Objetivos de ponto de recuperação (RPO) para serviços críticos e selecione estratégias de redundância—como agrupamento em cluster após falha, equilíbrio de carga ou replicação—que se adequem a estes objetivos e ao seu orçamento.

Esforce-se pela automatização tanto na deteção de falhas como no próprio processo de failover, uma vez que os sistemas automatizados fornecem a resposta rápida necessária para minimizar eficazmente os tempos de interrupção.

Lembre-se de considerar a redundância não só para os servidores, mas também para o suporte de componentes, tais como caminhos de rede, sistemas de armazenamento e fontes de energia, para garantir uma verdadeira resiliência.

Soluções de redundância de servidores e da OVHcloud

Explore as soluções de cloud versáteis da OVHcloud, concebidas para oferecer desempenho e escalabilidade, ao mesmo tempo que lhe permite construir sistemas resilientes e redundantes para alta disponibilidade. Encontre as bases ideais para os seus projetos:

Ícone do Bare Metal

Bare Metal

Experimente os melhores níveis de desempenho, controlo e segurança com os servidores Bare Metal da OVHcloud. Usufrua de servidores físicos dedicados com acesso direto ao hardware, garantindo uma potência máxima de processamento e uma latência mínima para as suas cargas de trabalho mais exigentes.

Ícone da Public Cloud

Public Cloud

Dê asas à agilidade e à inovação com o Public Cloud da OVHcloud. Construa, implemente e escale aplicações sem qualquer esforço através da nossa infraestrutura cloud flexível e económica. Aceda a uma gama completa de serviços a pedido, incluindo instâncias de cálculo, armazenamento de objetos, bases de dados, ferramentas de rede, plataformas de IA, entre outros.

Ícone da Hosted Private Cloud

Hosted Private Cloud

Combine a segurança e o controlo de um ambiente privado com a flexibilidade da cloud utilizando o Hosted Private Cloud da OVHcloud, otimizado pela tecnologia VMware. Usufrua de uma infraestrutura de hardware dedicada, totalmente gerida pela OVHcloud, que lhe oferece um ambiente isolado e seguro, ideal para aplicações sensíveis e indústrias regulamentadas.