Migration
AWS Disaster Recovery & Migration - Tổng Quan & Diagrams
Tổng quan DR Patterns, 6Rs, DMS, Snow Family, DataSync, Storage Gateway, Backup (Diagram)
📋 Mục lục
- Overview Diagram
- RPO & RTO
- 4 DR Patterns
- 6Rs Migration Strategies
- Data Transfer & Migration Services
- DMS - Database Migration Service
- AWS Backup
- Tổng hợp: Khi nào dùng service nào?
- Best Practices
- Exam Tips
Overview Diagram
Toàn cảnh Disaster Recovery & Migration trong AWS
Bảng so sánh nhanh
| Service | Câu hỏi trả lời | Ví dụ |
|---|---|---|
| DR Patterns | Khôi phục khi sự cố? | Backup/Restore → Active-Active |
| 6Rs | Chiến lược migration? | Rehost, Replatform, Refactor... |
| DMS | Migrate database? | Oracle → Aurora, MySQL → RDS |
| SCT | Convert DB schema? | Oracle schema → PostgreSQL |
| Snow Family | Data lớn, không có mạng? | 10 TB → Exabyte, ship vật lý |
| DataSync | Sync files qua mạng? | On-prem NFS → S3/EFS |
| Storage Gateway | Hybrid storage? | On-prem app dùng S3 như NFS |
| Transfer Family | SFTP/FTPS → AWS? | Partner upload files qua SFTP |
| AWS Backup | Backup tập trung? | Backup RDS, EBS, EFS, DynamoDB |
RPO & RTO
Hai khái niệm quan trọng nhất của DR
[!IMPORTANT] Tại sao RPO chỉ tính từ Last Backup → Disaster (không phải → Recovery)?
- Sau khi disaster xảy ra, hệ thống DOWN → không ai ghi thêm data mới → không mất thêm data
- RPO = data đã tạo nhưng chưa kịp backup trước khi sự cố
- RTO = thời gian hệ thống down nhưng không mất thêm data (vì không ai dùng được)
Ví dụ cụ thể:
- 8:00 AM — Backup xong ✅
- 8:00 → 10:00 — Users tạo data mới (2 giờ data)
- 10:00 AM — 💥 Disaster! Hệ thống down
- 10:00 → 14:00 — Đang recover (4 giờ down, nhưng không ai ghi data)
- 14:00 PM — ✅ Recovery xong, restore từ backup 8:00
- → RPO = 2h (mất data 8:00–10:00), RTO = 4h (down 10:00–14:00)
4 DR Patterns
Cost vs Recovery Time
Chi tiết từng Pattern
So sánh chi tiết
| Pattern | RPO | RTO | Cost | DR Region chạy gì? | Khi disaster thì làm gì? |
|---|---|---|---|---|---|
| Backup & Restore | Hours | 24+ hours | $ | Không có gì chạy, chỉ snapshots | Restore snapshots → Launch infra |
| Pilot Light | Minutes | 10-30 min | $$ | DB chạy, App OFF | Start app servers, promote DB |
| Warm Standby | Seconds | Minutes | $$$ | DB + App scaled-down (25%) | Scale up app, Route53 failover |
| Active-Active | ~0 | ~0 | $$$$ | 100% full, serving traffic | Không cần làm gì (auto) |
💾 Pattern 1: Backup & Restore — Chi tiết
🔥 Pattern 2: Pilot Light — Chi tiết
🌡️ Pattern 3: Warm Standby — Chi tiết
⚡ Pattern 4: Active-Active (Multi-Site) — Chi tiết
[!IMPORTANT] Pilot Light vs Warm Standby — Cách phân biệt dễ nhớ:
- Pilot Light = chỉ core (DB) chạy, app servers OFF → cần thời gian start
- Warm Standby = toàn bộ infra chạy nhưng scaled-down → chỉ cần scale up
- Tên "Pilot Light" từ ngọn lửa nhỏ trong lò gas — luôn cháy để sẵn sàng bật lên
- Tên "Warm Standby" = hâm nóng sẵn, mọi thứ "ấm" và chạy rồi
6Rs Migration Strategies
Từ dễ đến khó
So sánh Thời gian & Chi phí 6Rs
| Strategy | Thời gian Migration | Chi phí Migration | Effort | Long-term Cost | Long-term Benefit |
|---|---|---|---|---|---|
| Rehost | ⏱️ Ngắn (days-weeks) | 💰 Thấp | ★☆☆☆☆ | Cao (chạy EC2 raw) | Nhanh lên cloud |
| Replatform | ⏱️ Trung bình (weeks) | 💰 Thấp-TB | ★★☆☆☆ | TB (managed svc) | Giảm ops burden |
| Repurchase | ⏱️ Trung bình (weeks) | 💰 TB (license SaaS) | ★★☆☆☆ | TB (subscription) | Zero maintenance |
| Refactor | ⏱️ Dài (months) | 💰 Cao (dev cost) | ★★★★★ | Thấp nhất | Cloud-native, scale tốt |
| Retire | ⏱️ Ngắn (days) | 💰 Không tốn | ★☆☆☆☆ | 💲0 | Giảm complexity |
| Retain | ⏱️ Không migrate | 💰 Không tốn | ★☆☆☆☆ | Giữ nguyên | Chờ plan sau |
[!TIP] Exam key: Nếu đề nói "reduce operational burden" hoặc "move to managed service" → Replatform (KHÔNG phải Rehost!)
Data Transfer & Migration Services
Chọn service nào để chuyển data?
So sánh Data Transfer Services
| Service | Loại data | Cách chuyển | Speed | Use case |
|---|---|---|---|---|
| DMS | Database | Online, CDC | Network-dep | DB migration, continuous replication |
| DataSync | Files (NFS/SMB) | Online, agent | Up to 10Gbps | One-time or scheduled sync |
| Snow Family | Any data | Physical ship | Days (shipping) | Massive data 10TB+, no/slow network |
| Storage Gateway | Files/Blocks/Tapes | Hybrid bridge | Network-dep | Ongoing hybrid access |
| Transfer Family | Files (SFTP/FTPS) | Online, managed | Network-dep | B2B file exchange |
| S3 Transfer Accel | S3 objects | CloudFront Edge | Faster upload | Large uploads cross-region |
Snow Family: Chọn device nào?
Storage Gateway: 3 loại Gateway
[!NOTE] Storage Gateway vs DataSync:
- Storage Gateway = hybrid bridge, on-prem apps liên tục dùng S3/FSx qua NFS/SMB (ongoing access)
- DataSync = chuyển data một lần hoặc scheduled sync (migration/sync job)
- Storage Gateway KHÔNG migrate data cũ — cần DataSync hoặc Snow Family cho initial migration
DMS - Database Migration Service
Architecture & Flow
Khi nào cần SCT (Schema Conversion Tool)?
AWS Backup
Backup tập trung cho nhiều services
Tổng hợp: Khi nào dùng service nào?
Decision Tree chi tiết
Câu hỏi thường gặp trong exam
| Câu hỏi | Đáp án |
|---|---|
| "Minimal downtime DB migration?" | DMS (CDC mode) |
| "Oracle → Aurora PostgreSQL?" | SCT + DMS |
| "MySQL → RDS MySQL?" | DMS only (homogeneous) |
| "100 TB data, no internet?" | Snowball Edge |
| "10 PB data center migration?" | Snowmobile |
| "Sync on-prem NFS to S3?" | DataSync |
| "On-prem app dùng S3 như NFS?" | S3 File Gateway |
| "Replace physical tape backup?" | Tape Gateway |
| "Partner upload files qua SFTP?" | Transfer Family |
| "Centralized backup, cross-region?" | AWS Backup |
| "RPO ~0, RTO ~0?" | Active-Active (Multi-Site) |
| "Lowest cost DR?" | Backup & Restore |
| "DB replicate, app OFF?" | Pilot Light |
| "Full infra nhưng scaled-down?" | Warm Standby |
| "Reduce operational burden?" | Replatform (6Rs) |
| "Viết lại code cloud-native?" | Refactor (6Rs) |
| "Chuyển nguyên xi lên cloud?" | Rehost / Lift & Shift (6Rs) |
Replication Services cho DR
AWS services hỗ trợ cross-region replication
Best Practices
Exam Tips
[!TIP] Ghi nhớ nhanh:
- RPO = bao nhiêu DATA mất (Recovery Point) → liên quan đến backup frequency
- RTO = bao lâu DOWN (Recovery Time) → liên quan đến infra sẵn sàng
- Backup/Restore = rẻ nhất, chậm nhất
- Active-Active = đắt nhất, nhanh nhất (RTO ≈ 0)
- Pilot Light = chỉ DB chạy (ngọn lửa nhỏ)
- Warm Standby = toàn bộ chạy nhưng scaled-down
- DMS = database migration, KHÔNG downtime
- SCT = cần khi khác engine (heterogeneous)
- Snow Family = physical data transfer, > 10 TB
- DataSync = online file sync (NFS/SMB → AWS)
- Storage Gateway = hybrid bridge (ONGOING access)
[!CAUTION] Dễ nhầm lẫn:
- Pilot Light vs Warm Standby? → PL = chỉ DB chạy / WS = cả app chạy (scaled-down)
- DataSync vs Storage Gateway? → DataSync = migration/sync job / SGW = ongoing hybrid access
- DataSync vs Snow? → DataSync = qua mạng / Snow = physical ship (> 10 TB)
- DMS vs SCT? → DMS = migrate data / SCT = convert schema (dùng khi khác engine)
- Rehost vs Replatform? → Rehost = nguyên xi / Replatform = dùng managed service (reduce operational burden)
- S3 File Gateway vs FSx File Gateway? → S3 FG = NFS/SMB→S3 / FSx FG = SMB→FSx Windows
- Storage Gateway KHÔNG migrate data cũ — cần DataSync/Snow cho initial migration