Blogs

illustrations illustrations illustrations illustrations illustrations illustrations illustrations

“카카오 이중화 제대로 안 됐다” 정부 공식 확인

Published on Dec 07, 2022 by 지형철 on KBS

“카카오 이중화 제대로 안 됐다” 정부 공식 확인














정부의 공식 조사 결과가 나왔는데요, 화재가 난 배터리와 비상전원장치가 인접해 있었고, 카카오는 서비스 이중화가 제대로 안 돼 있었던 사실이 확인됐습니다.

2022년 10월 15일 15시 30분 경, 경기도 성남시 삼평동에 위치한 SK주식회사C&C 판교캠퍼스 A동 지하 3층 전기실에서 화재가 발생했고 이 과정에서 서버 작동에 필요한 전원 공급이 끊겨 카카오의 서비스가 다운되어버린 사건이 벌써 2개월이 지났다.

메시지 주고받기부터 결제 등 연관된 모든 서비스가 먹통이 된 판교 데이터센터 화재…

조사에 나선 과학기술정보통신부는 불이 시작된 리튬이온 배터리와 일부 비상 전원 공급장치가 분리되지 않은 곳에 있었다고 확인했습니다.

화재로 이 장치가 멈추며 일부 전원이 끊기고, 전력선마저 손상됐고, 물을 뿌려야 하는데 특정 구역만 차단하는 스위치를 못 찾아 전원을 선별적으로 끄지 못하면서 사태가 커졌습니다.

네이버 서비스 대부분은 12시간 내 정상화됐지만 카카오 주요 서비스는 127시간 30분간 장애를 빚었습니다.

차이는 이중화의 완성도.

네이버는 데이터센터 간 이중화 조치를 해놨습니다.

카카오도 화재가 난 판교 데이터센터 서버를 동작, 다른 서버를 대기로 이중화는 해놨는데, 대기 서버를 깨우는 권한을 판교에만 두는 바람에 제때 가동하지 못했습니다.

여러 서비스에 공통적으로 필요한 장치들에 대한 이중화도 미흡했습니다.

[이종호/과학기술정보통신부 장관 : “여러 서비스의 구동에 필요한 카카오인증과 같은 핵심기능도 판교 센터에 집중되어 여러 서비스에 광범위한 영향을 미친 원인이 되었습니다.”]

데이터센터에 화재 대비 메뉴얼은 있었지만 모의 훈련은 없었고, 카카오도 재난 대비 훈련은 했지만, 데이터센터 전체가 멈추는 수준의 대형 사태에 대한 대비는 부족했습니다.

과기부는 데이터센터를 관리하는 sk c&c와 카카오, 네이버에 한 달 내에 개선 조치를 보고하라고 했습니다.

한편 이번 사태의 시작인 배터리 발화 원인은 아직 구체적으로 나오지 않았단 이유로 발표에서 빠졌습니다.

기사

지형철 (ican@kbs.co.kr)

2022.12.07