최근 IDC 화재로 인해 언급되던 DR(Disaster Recovery)이 무엇인지 정리해 보려고 한다.
Disaster Recovery란 단어를 직역하자면 재난 복구 계획이란 뜻인데, 뜻 그대로 각종 재해가 일어났을때 복구하거나 지속할 목적으로 준비하는 과정 또는 정책 절차를 의미하며, 상황에 대비해 준비하는 것을 의미한다.
재해 복구시스템 종류는 아래와 같다.
순서는 RTO(Recovery Time Object) 기준
- Mirror Site
- 업무 환경과 거의 동일한 환경으로 동기화되고 있거나, 함께 보조적으로 운영된다
- Replica 느낌
- RTO: 0 ~ 수분 이내
- Hot Site
- 재난 발생으로 영향을 받는 업무 기능을 즉시 복구할 수 있도록 전산센터와 동일한 모든 설비와 자원을 보유하고 있다.
- RTO: 4시간 이내
- Warm Site
- 부분적으로 설비를 가지고 있는 백업 사이트로서, 대개 디스크 드라이브, 테이프 드라이브와 같이 가격이 저렴한 주변기기를 가지고 있으나, 주 컴퓨터는 가지고 있지 않다.
- RTO: 수일 이내
- Cold Site
- 재난 발생시 새로운 컴퓨터를 설치할 수 있는 컴퓨터실을 미리 준비해 둔 것으로서 전기, 냉방, 공간 정도만 마련되어 있으며 별다른 전산 장비는 가지고 있지 않다.
- RTO: 수주 ~ 1개월

RTO( Recovery Time Objective ), RPO( Recovery Point Objective )
위의 그림과 본문에서 RTO/RPO란 단어가 보이는데, 쉽게 생각하면 목표한 복구 시간, 시점을 얘기하는데 아래를 참고해보자.
- RTO( Recovery Time Objective )
- 직역 하자면 목표 복구 시간
- 서비스가 중단을 시작으로 복구되는 시간의 지연을 의미, downtime이라고 보면 될듯 싶다.
- RPO( Recovery Point Objective )
- 직역 하자면 목표 복구 시점
- 서비스 중단 지점을 기점으로 데이터 손실 수용 가능한 시점을 의미


이렇게 서비스 복구 재해에 대해 간단하게 알아봤다.
복구 방법은 많고 갖갖이 장단점이 있는것 같으나, 제일 좋은 복구 방법은 역시나 realtime으로 backup, replication 운용 하는 방식인듯 싶다. 물론 서버 규모가 커질수록 리소스 부담이 큰게 단점이고, 수용할 수 있는 상황이 아니라면 복구 방법에 대해선 깊게 고민해볼 필요가 있을것 같다.
출처:
Disaster Recovery (DR) Architecture on AWS, Part III: Pilot Light and Warm Standby | Amazon Web Services
In this blog post, you will learn about two more active/passive strategies that enable your workload to recover from disaster events such as natural disasters, technical failures, or human actions. Previously, I introduced you to four strategies for disast
aws.amazon.com
Disaster Recovery (DR) objectives - Reliability Pillar
Disaster Recovery (DR) objectives In addition to availability objectives, your resiliency strategy should also include Disaster Recovery (DR) objectives based on strategies to recover your workload in case of a disaster event. Disaster Recovery focuses on
docs.aws.amazon.com
https://www.rubrik.com/blog/technology/19/5/rpo-rto-disaster-recovery
RPO & RTO for Your Disaster Recovery Plan | Rubrik
Downtime and data loss can have huge business and financial impact. Learn how to determine your RPOs and RTOs to meet your availability SLAs.
www.rubrik.com
'개발' 카테고리의 다른 글
| Easy Random을 활용한 Unit Test (0) | 2023.03.08 |
|---|---|
| [후기] NHN forward 2022 (0) | 2022.11.26 |
| flyway를 이용한 db migration (0) | 2022.10.05 |
| [네트워크]패킷 (0) | 2022.07.31 |
| SSH into docker container (0) | 2022.07.11 |