Atmo Digital — Disaster Recovery Plan

1. Purpose

This Disaster Recovery (DR) Plan defines how Atmo Digital restores critical services and recovers data after a major disruption, minimizing downtime and data loss.

2. Scope

The plan covers production, staging, and development environments, as well as repositories, databases, and supporting infrastructure managed by Atmo Digital.

3. Roles & Responsibilities

CTO (DR Lead) — Activates the plan, coordinates recovery, and communicates with stakeholders.
System Owners — Execute restoration steps for their services and validate functionality.
All Personnel — Report incidents promptly and follow DR procedures.

4. Recovery Objectives

RTO (Recovery Time Objective): Defined per critical system and reviewed periodically.
RPO (Recovery Point Objective): Aligned to backup and snapshot schedules.

5. Architecture & Redundancy

Multi-cloud deployment: Production workloads are distributed across DigitalOcean and Contabo to reduce single-provider risk and improve resilience.
Segregated environments: Separate production and non-production networks and access policies.

6. Backup Strategy

Source code: Primary storage in GitHub private repositories; a local mirror is maintained on the company server for contingency.
Databases: Scheduled backups with defined retention; backups stored encrypted and replicated across providers/regions as applicable.
Infrastructure & configs: Snapshots/exports of critical services; infrastructure-as-code and deployment scripts stored in version control.
Integrity validation: Periodic test restores to verify backup integrity.

7. DR Procedures

Trigger & Assessment: CTO assesses impact and activates DR Plan.
Containment: Isolate affected components and secure evidence/logs.
Restore Services: Re-provision infrastructure in the healthiest provider (DigitalOcean or Contabo), deploy from GitHub/local mirror, restore databases from the latest valid backup (per RPO).
Validation: Run smoke tests and service health checks; obtain owner sign-off.
Communication: Notify stakeholders on status, ETA, and post-restoration stability.
Post-incident review: Root-cause analysis and corrective actions.

8. Testing & Maintenance

DR procedures are reviewed at least annually and after material infrastructure changes. Test restorations are conducted periodically to validate RTO/RPO assumptions and backup integrity.

9. Dependencies & Contacts

Repositories: GitHub (private), local mirror on company server.
Cloud providers: DigitalOcean, Contabo.
Contact: contato@atmodigital.com.br

1. Propósito

Este Plano de Recuperação de Desastres (DR) define como a Atmo Digital restaura serviços críticos e recupera dados após uma interrupção grave, minimizando indisponibilidade e perda de informações.

2. Escopo

O plano cobre ambientes de produção, homologação e desenvolvimento, além de repositórios, bancos de dados e infraestrutura de suporte gerenciados pela Atmo Digital.

3. Papéis & Responsabilidades

CTO (Líder de DR) — Ativa o plano, coordena a recuperação e comunica o status às partes interessadas.
Responsáveis de Sistemas — Executam os passos de restauração de seus serviços e validam a funcionalidade.
Todos — Reportam incidentes prontamente e seguem os procedimentos de DR.

4. Objetivos de Recuperação

RTO (Recovery Time Objective): Definido por sistema crítico e revisto periodicamente.
RPO (Recovery Point Objective): Alinhado às rotinas de backup e snapshots.

5. Arquitetura & Redundância

Implantação multi-cloud: Cargas de produção distribuídas entre DigitalOcean e Contabo para reduzir risco de dependência única e aumentar a resiliência.
Ambientes segregados: Redes e políticas de acesso distintas para produção e não produção.

6. Estratégia de Backup

Código-fonte: Armazenamento primário em repositórios privados no GitHub; uma cópia local é mantida no servidor da empresa para contingência.
Bancos de dados: Backups agendados com retenção definida; backups armazenados de forma criptografada e replicados entre provedores/regiões quando aplicável.
Infra & configurações: Snapshots/exports de serviços críticos; infraestrutura como código e scripts de deployment versionados.
Validação de integridade: Restaurações de teste periódicas para verificar integridade dos backups.

7. Procedimentos de DR

Gatilho & Avaliação: CTO avalia o impacto e ativa o Plano de DR.
Containment: Isolar componentes afetados e preservar evidências/logs.
Restauração: Reprovisionar a infraestrutura no provedor mais saudável (DigitalOcean ou Contabo), publicar a partir do GitHub/cópia local e restaurar bancos a partir do último backup válido (conforme RPO).
Validação: Executar smoke tests e checagens de saúde; obter aprovação do responsável.
Comunicação: Informar stakeholders sobre status, estimativa e estabilidade pós-restauração.
Pós-incidente: Análise de causa raiz e ações corretivas.

8. Testes & Manutenção

Os procedimentos de DR são revisados ao menos anualmente e após mudanças materiais de infraestrutura. Restaurações de teste são realizadas periodicamente para validar premissas de RTO/RPO e a integridade dos backups.

9. Dependências & Contatos

Repositórios: GitHub (privado), espelho local no servidor da empresa.
Provedores de nuvem: DigitalOcean, Contabo.
Contato: contato@atmodigital.com.br