티스토리 뷰
카카오 서비스 먹통 사태로 한국은 이제 전산시스템에 대한 백업시스템 점검 및 재해복구 시스템 운영 관리 등의 모의 훈련 열풍에 불게 된다.(개인적 생각) 아니다. 2022년 10월부터 관공서 및 주요 대기업 등의 데이터센터에서는 비상이 걸렸다. 형식적으로 재해복구가 가능한 시스템이라고 승인과 인증을 했던 모든 것들이 백지화가 되며 전산관리자 및 경영진이 한마디로 잠시 정신 차릴 순간이 도래했다.
이제 2022년 10월 이후부터 형식적인 재해복구는 어렵다 진짜 재해복구가 되어야 한다
판교 SK C&C 데이터센터 UPS 장비 배터리에서 발생된 불꽃으로 시작된 화재로 카카오 서비스 전체가 먹통이 되는 전산 관련 사건, 사고에 큰 획을 그린 사례로 남게 되었다.
카카오 측에서 이런저런 이유를 들어 이번 사건에 대해서 설명을 했지만 조금 부족한 부분이 바로 SK C&C 데이터센터의 운영 및 장애 대응에 대해서는 카카오가 욕을 먹고 있을 때 너무 욕을 덜 먹었다는 점이다. 분명 문제가 많았을 것인데....
SK 데이터 센터 측의 운영 담당자 및 책임자의 고개 숙인 모습은 전혀 찾아볼 수가 없었던 것은 나의 개인적인 느낌일까?
잠시 이야기가 옆길로 가버렸다. 아무튼 이런 극단적인 재난 상황과 셧다운을 대비한 전산시스템에 대한 재해 대응 및 복구 시스템을 구축하지 못했다는 비난은 카카오와 SK 측 모두 비난을 피하기 어려울 것 같다.
이 글의 썸네일 사진의 전산시스템(=정보시스템)의 비상조직들의 사건, 사고가 발생했을 때 역할 및 업무 내용은 여러 산업군 업종별로 작은 차이는 있지만 굵직한 부분은 일맥상통한다.
중견 기업을 기준으로 평상시에는 전산팀은 크게 3가지로 구분되어 각자의 역할에 맞게 기업의 혈액이 되어 전사적으로 피를 공급하는 매우 중요한 일을 하고 있다. 시스템관리 & 소프트웨어관리 & 네트워크관리이다. 흔히 시스템운영팀, 개발팀으로 작게 분류해서 운영되기도 한다.
이런 조직 구조에서 비상사태가 발생되면 총괄팀, 복구팀, 복구지원팀의 3개의 팀이 운영되면서 총괄팀은 상황실을 운영하면서 복구에 필요한 인원/자원을 지원하고 장애 내용을 신속히 확인하고 내부 공지를 통해서 비상 운영 계획 및 복구 계획 수립 업무를 총괄하게 된다.
복구팀은 피해를 신속히 파악하고 총괄팀에게 보고한다. 이후 상황실의 지시에 따라 협력업체 및 시스템 공급 업체와 긴급회의를 해서 전산시스템 복구(서버, 네트워크, 데이터베이스, 소프트웨어 등)를 한다. 복구 진행 상황을 지속적으로 모니터링하면서 주기적으로 상황실에 보고를 하게 된다. 복구팀은 장애 복구 소요 시간을 추정하고 보고하게 되는데 이번 카카오 먹통 사태에서 이 부분이 미약했다.
복구지원팀은 관리부서인 경영팀 및 경영관리팀 등이 하게 되는데 고객 및 협력업체에게 전화 대응 및 안내를 하고 내부 직원들에게 상황을 공지하기도 한다. 총괄팀 상황실 공지에 따라 내부 및 대외적으로 상황 발표를 하기도 한다.
전산 시스템에 재해 및 장애가 발생했을 때 통제가 가능한 부분과 통제가 불가능한 경우가 있다. 인적-기술적-시스템-운영-구조 장애는 평상시 훈련과 상황에 맞게 통제가 될 수 있지만 자연재해(화재, 지진, 태풍-장마-폭우의 수재 등)와 전쟁 및 사이버테러 등의 인적 재해는 혹독한 훈련을 하지 않으면 통제가 불가능하다.
이번 카카오 먹통 사태는 카카오에서는 자연재해 분류에서 화재로 구분해서 전산시스템(정보시스템) 복구를 통제하기 힘들었다고 알려지고 있다.
이 글 제목에서 언급된 부분의 증명자료 사진이다. 한국 조달청에서 운영 중인 나라장터 국가종합전자조달 시스템이 재해복구 훈련으로 서비스를 중단한다는 내용의 공지이다.
중단 시간은 2022년 10월 28일 금요일 19시부터 10월 30일 일요일 19시까지이다. 금요일, 토요일, 일요일 약 3일간 통제 불능의 재해 상황을 고려해서 재해 복구 모의 훈련을 한다는 것이다. 소 잃고 외양간 안 고치려면 어쩔 수 없다.
과연 조달청에서 관리하는 전산시스템만 재해복구 훈련을 할까? 아니다. 예상이 맞다면 2022년 올해가 가기 전에 웬만한 곳에서는 이런 모의 훈련을 분명 실시할 것이다. 이제 기관 및 기업의 전산 책임자 및 담당자 그리고 관련 관리직의 사람들은 긴장 바짝 하고, 재해복구에 대해서 심각하게 고민하고 해결을 해야 한다.
특히 금융권, 국가 주요 기관 시스템, 대기업의 책임자 및 담당자는 올해가 지나가기 전에 심신이 지쳐 쓰러질 수도 있을 것이다. 모두 건강관리에 유의하시길 바란다. 생각만 해도 스트레스가 쌓인다. 관련 업종에 근무를 해봐서 상황이 그려진다.
나는 그런 관련 업무에서 벗어나서 정보 서비스를 소비하는 소비자가 되어서 입장이 바뀌었지만 부디 모두 힘내길 바란다. 소 잃고 외양간 고치면 안 된다. 백업시스템 및 재해복구 시스템을 비용을 들여 구축을 해야 한다고 했지만 매번 예산이 없다고 구축을 못한 전산책임자라면 이번 기회에 신규 구축을 목표로 기회를 삼고, 복구 시스템이 구축되어 있었지만 여러 상황이 안 맞아서 모의 훈련을 못했던 전산 책임자라면 이때 아니면 모의 훈련을 못한다는 각오로 열심히 하시길 바란다.