| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 소프티어
- 코딩교육봉사
- 데이터베이스
- 알고리즘
- SW봉사
- 1과목
- MYSQL
- 코딩봉사
- 정보처리산업기사
- kotlin
- 코틀린
- 프로그래머스
- 파이썬
- docker
- 회고
- CJ UNIT
- SQL
- 백준알고리즘
- 문제풀이
- 자바
- python
- 백준 알고리즘
- 도커
- java
- BFS
- C++
- 백준
- programmers
- 공부일지
- softeer
- Today
- Total
JIE0025
DR (Disaster Recovery) 재해복구란 ? 본문
✅ DR (Disaster Recovery)
재해복구를 의미한다.
자연재해/ 사이버 공격 /시스템 장애 상황에서 IT시스템과 가용성을 최대한 빠르게 복구하는 과정이다.
✅ 최근 사례
https://www.etnews.com/20250928000045
[국정자원 화재, 정부시스템 마비]반쪽짜리 재해복구(DR) 시스템, 피해 키웠다
대한민국 디지털 행정 심장부인 국가정보자원관리원(국정자원) 대전 본원에서 발생한 화재 피해가 '정부24', '우체국 금융' 등 주요 서비스 마비라는 참사로 이어진 것은 반쪽짜리 재해복구(DR)
www.etnews.com

시스템 마비가 발생하면 (Shutdown)
해당시스템을 고객이 이용 못하는것은 물론이며,
관련된 기업체에도 영향이 가게 된다.


재해복구 시스템을 결국 Active - Active형태로 구축해두어야 재해 발생시에도 안전한 서비스 제공이 가능해진다.
✅ DRP (재난 복구 계획)
계획되지 않은 상황에서의 비즈니스 중단에 대응하기 위한 지침을 문서화하는 체계적인 접근 방식이다.
IT 인프라 / Application / Data 복구를 위한 세부적인 계획을 세운다.
🔵 준비 방법
1. 인프라 목록 작성
-> HW /SW의 목록을 작성한다.
만약 SW기반으로 운영중인 기업은 이 작업이 훨씬 쉬워진다고 한다 ( 데이터센터 물리적 구성 요소를 조사할 필요가 없어서)
2. 위험 평가 수행
기업이 감당 가능한 다운타임 / 데이터 손실을 결정한다.
IT에 크게 의존할수록 다운타임을 많이 견디지 못한다.
3. 커뮤니케이션 계획 수립
재해 발생시 직원에게 관련 정보를 제공할 수 있고, DR중 비즈니스 운영을 계속하기 위한 액세스 방법을 알 수 있게 된다.
4. SLA 체결
외부 기업이 제공하지만 중요한 시스템인 경우 서비스 수준 계약에 재해와 관련된 내용을 포함한다.
5. 정기적인 솔루션 테스트
DR 모의 훈련 및 테스트를 진행한다.
** 정보 시스템 재해복구 지침 이라 검색하면
관련 예시 지침서 파일들을 확인할 수 있다.
✅ DRS (재난 복구 시스템)
Disaster Recovery System의 약자
재난 복구 계획의 수행을 지원하기 위한 시스템이다.
🔵 용어 정리
# 복구 시간 목표 (Recovery Time Objective - RTO)
- 재해 발생시 서비스가 복구되는데 걸릴수 있는 시간이다.
- 서비스 중단을 감내할 수 있는 최대시간을 결정한다.
- RTO 가 만약 4시간인 경우 4시간 이내에 서비스 복구가 완료되는것을 목표로 한다.
# 복구 시점 목표 (Recovery Point Objective - RPO )
재해 발생시 데이터 손실을 허용할수있는 시간 / 최소 백업 빈도를 결정한다.
RPO가 4시간인 경우 4시간마다 백업이 이루어진다.
마지막 백업 시점에서 3시간 후에 재해가 발생했다면 3시간의 데이터 손실을 감당해야한다.

🔵 복구 시스템 유형 4가지
복구시간/ 범위 정도에 따라 4가지 유형으로 분류된다.
미러 사이트 / 핫 사이트 / 웜 사이트 / 쿨 사이트
# 미러 사이트 (1등급)
데이터센터와 동일한 수준의 DR센터를 Active 상태로 구축하여 실시간동기화 하여 운영하는 방식이다.
실시간 미러링 (이론상 RPO = 0) 으로 데이터 최신 상태를 유지하고 재해발생시 즉시 복구가 가능하다.
기존 데이터센터와 동일한 DR센터를 Activve로 구축하는 만큼 투자비용 및 유지보수 비용이 크게 든다.
# 핫 사이트 (2등급)
데이터 센터와 동일한 수준의 DR 센터를 구축하는데 Active Standby 형태인것이다.
재해발생시 DR 센터를 Active로 전환하여 서비스를 제공한다.
RPO=0 을 지향하는 실시간 미러링을 통해 데이터를 최신상태로 유지하고
재해발생 복구시간은 약 4시간 이내라고 한다.
# 웜 사이트 (3등급)
데이터센터와 동일한 수준의 DR센터를 구축하되, 중요도가 높은 데이터만 DR센터에부분적으로 저장하는 방식이다.
그외 일반 데이터에 대한 백업은 RPO 수시간 ~ 1일 단위로 진행된다.
초기투자 /유지보수 비용은 저렴하지만 복구 수준이 완전하지 못하다.
# 콜드 사이트 (4등급)
최소한의 수준으로 DR센터를 구축, 데이터만 보관하는 방식이다.
백업이 일~주단위로 진행되고
복구시간은 주~월 단위 소요된다.
비용이 가장 저렴하지만 복구시간이 너무 길고 신뢰성이 낮아서
주로 미러사이트/핫사이트를 보완하기 위해 사용된다고한다.
사실 비용 때문에 DRS구축에도 한계가 있다.
네트워크 /전기 비용 등의 유지보수 비용이 예산이 크다.
서버추가만 하더라도 1대당 약 1400만원이라고 한다.
또한 물리적인 DR센터는 재해발생 전까지 모든 장비가 유휴 상태로 유지된다는 단점도 있다...
✅ DR을 실행하지 않는다면?
기업은 운영 재무 평판 측면에서 위험해진다.
비즈니스를 운영할 수 없고, 직원은 업무 수행이 불가능해진다.
이에 따라 고객이 타 제품/서비스의 소비를 결정하게 되면 기업에 큰 손실이 된다.
기업은 재해복구 절차를 잘 준비하고 대응 전략에 따라
DR 상황에서의 절차를 잘 준비해야한다.
References
https://news.nate.com/view/20250927n07861
https://www.etnews.com/20250928000045
https://www.nutanix.com/ko/info/disaster-recovery
https://library.gabia.com/contents/infrahosting/12209/
'Infra > System' 카테고리의 다른 글
| Zenius EMS 8.0 활용 세미나 요약 (0) | 2025.05.29 |
|---|