Recent Posts
Recent Comments
250x250
관리 메뉴

JIE0025

DR (Disaster Recovery) 재해복구란 ? 본문

Infra/System

DR (Disaster Recovery) 재해복구란 ?

sdoaolo 2025. 10. 10. 20:58

 

 

 

 ✅ DR  (Disaster Recovery)

 

재해복구를 의미한다. 

자연재해/ 사이버 공격 /시스템 장애 상황에서  IT시스템과 가용성을 최대한 빠르게 복구하는 과정이다. 

 

 

 

 ✅ 최근 사례 

https://www.etnews.com/20250928000045

 

[국정자원 화재, 정부시스템 마비]반쪽짜리 재해복구(DR) 시스템, 피해 키웠다

대한민국 디지털 행정 심장부인 국가정보자원관리원(국정자원) 대전 본원에서 발생한 화재 피해가 '정부24', '우체국 금융' 등 주요 서비스 마비라는 참사로 이어진 것은 반쪽짜리 재해복구(DR)

www.etnews.com

 

 

https://www.etnews.com/20250928000045

 

 

 

시스템 마비가 발생하면 (Shutdown) 

해당시스템을 고객이 이용 못하는것은 물론이며, 

관련된 기업체에도 영향이 가게 된다. 

 

https://news.nate.com/view/20250927n07861

 

 

 

재해복구 시스템을 결국 Active - Active형태로 구축해두어야  재해 발생시에도 안전한 서비스 제공이 가능해진다. 

 

 

 

 

 ✅ DRP (재난 복구 계획)

 

계획되지 않은  상황에서의   비즈니스 중단에 대응하기 위한 지침을  문서화하는 체계적인 접근 방식이다.

 

IT 인프라 / Application / Data 복구를 위한 세부적인 계획을 세운다. 

 

 

 

 

 

🔵 준비 방법

 

1. 인프라 목록 작성

-> HW /SW의 목록을 작성한다. 

만약 SW기반으로 운영중인 기업은 이 작업이 훨씬 쉬워진다고 한다 ( 데이터센터 물리적 구성 요소를 조사할 필요가 없어서) 

 

2. 위험 평가 수행

기업이 감당 가능한 다운타임 / 데이터 손실을 결정한다. 

IT에 크게 의존할수록 다운타임을 많이 견디지 못한다. 

 

3. 커뮤니케이션 계획 수립

재해 발생시 직원에게 관련 정보를 제공할 수 있고,    DR중 비즈니스 운영을 계속하기 위한  액세스 방법을 알 수 있게 된다. 

 

4. SLA 체결

외부 기업이 제공하지만  중요한 시스템인 경우  서비스 수준 계약에  재해와 관련된 내용을 포함한다. 

 

5. 정기적인 솔루션 테스트 

DR 모의 훈련 및  테스트를 진행한다. 

 

 


**   정보 시스템 재해복구 지침  이라 검색하면

관련 예시 지침서 파일들을 확인할 수 있다. 

 

 

 

  ✅ DRS (재난 복구 시스템)

 

Disaster Recovery System의 약자 

재난 복구 계획의 수행을 지원하기 위한  시스템이다. 

 

 

 

 

🔵  용어 정리

 

# 복구 시간 목표 (Recovery Time Objective - RTO) 

  • 재해 발생시 서비스가 복구되는데 걸릴수 있는 시간이다. 
  • 서비스 중단을 감내할 수 있는 최대시간을 결정한다.
  • RTO 가 만약 4시간인 경우   4시간 이내에 서비스 복구가 완료되는것을 목표로 한다. 

 

# 복구 시점 목표 (Recovery Point Objective - RPO )

재해 발생시 데이터 손실을 허용할수있는 시간 / 최소 백업 빈도를 결정한다. 

RPO가 4시간인 경우   4시간마다 백업이 이루어진다. 

마지막 백업 시점에서  3시간 후에 재해가 발생했다면 3시간의 데이터 손실을 감당해야한다. 

 

https://library.gabia.com/contents/infrahosting/12209/

 

 

 

 

🔵 복구 시스템 유형 4가지 

 

복구시간/ 범위 정도에 따라 4가지 유형으로 분류된다. 

 

미러 사이트 / 핫 사이트 / 웜 사이트 / 쿨 사이트

 

 

 

 

# 미러 사이트   (1등급)   

 

데이터센터와 동일한 수준의 DR센터를  Active 상태로 구축하여  실시간동기화 하여 운영하는 방식이다. 

 

실시간 미러링 (이론상 RPO = 0) 으로 데이터 최신 상태를 유지하고 재해발생시 즉시 복구가 가능하다. 

기존 데이터센터와 동일한 DR센터를 Activve로 구축하는 만큼  투자비용 및 유지보수 비용이 크게 든다. 

 

 

# 핫 사이트 (2등급)

데이터 센터와 동일한 수준의 DR 센터를 구축하는데  Active Standby 형태인것이다. 

 

재해발생시 DR 센터를 Active로 전환하여 서비스를 제공한다. 


RPO=0 을 지향하는  실시간 미러링을 통해  데이터를 최신상태로 유지하고 

재해발생 복구시간은 약 4시간 이내라고 한다. 

 

 

# 웜 사이트 (3등급)

데이터센터와 동일한 수준의 DR센터를 구축하되, 중요도가 높은 데이터만 DR센터에부분적으로 저장하는  방식이다. 

 

그외 일반 데이터에 대한 백업은   RPO 수시간 ~ 1일 단위로 진행된다. 

 

 

초기투자 /유지보수 비용은 저렴하지만 복구 수준이 완전하지 못하다. 

 

 

# 콜드 사이트 (4등급)

최소한의 수준으로 DR센터를 구축, 데이터만 보관하는 방식이다. 

 

 

백업이 일~주단위로 진행되고

복구시간은 주~월 단위 소요된다. 

비용이 가장 저렴하지만 복구시간이 너무 길고 신뢰성이 낮아서  

주로 미러사이트/핫사이트를 보완하기 위해 사용된다고한다. 

 

 

 

 

 

 

사실 비용 때문에 DRS구축에도 한계가 있다.  

네트워크 /전기 비용 등의 유지보수 비용이 예산이 크다. 

서버추가만 하더라도 1대당 약 1400만원이라고 한다. 

 

 

또한 물리적인 DR센터는  재해발생 전까지 모든 장비가 유휴 상태로 유지된다는 단점도 있다...

 

 


 ✅ DR을 실행하지 않는다면? 

 

기업은 운영 재무 평판 측면에서 위험해진다. 

 

비즈니스를 운영할 수 없고,  직원은 업무 수행이 불가능해진다. 

 

이에 따라 고객이  타 제품/서비스의 소비를 결정하게 되면  기업에 큰 손실이 된다. 

 

 

 

기업은 재해복구 절차를 잘 준비하고 대응 전략에 따라 

DR 상황에서의 절차를 잘 준비해야한다. 

 

 

 


 

References 

 

https://news.nate.com/view/20250927n07861

https://www.etnews.com/20250928000045

https://www.nutanix.com/ko/info/disaster-recovery

https://library.gabia.com/contents/infrahosting/12209/

 

 

 

 

 

728x90

'Infra > System' 카테고리의 다른 글

Zenius EMS 8.0 활용 세미나 요약  (0) 2025.05.29