패스틀리 장애가 보여준 ‘인터넷 집중화’의 위험성

글 / 가비아 클라우드 콘텐츠팀

지난 8일에 전 세계 인터넷이 잠시 동안 마비되는 사고가 있었다. 뉴욕타임스(NYT), 영국 BBC와 같은 유명 언론사부터 아마존, 깃허브, 미국 백악관, 영국 정부 사이트 등 해외 주요 웹사이트에 접속할 수 없었다.

 

장애는 1시간 만에 복구됐지만, 피해는 광범위했다. 서비스 사용의 불편함은 물론이고 금전적 손실 또한 추정되었다. 글로벌 시장조사 업체 칸타(Kantar)는 이번 접속 장애로 디지털 광고 손실액이 시간당 2,900만 달러(약 323억 5,000억 원)에 달할 것이라고 전했다.

 

문제가 발생했던 웹사이트들에는 공통점이 있었다. 바로 클라우드 서비스 업체인 ‘패스틀리(Fastly)’의 콘텐츠 전달 네트워크(Content Delivery Network, CDN)를 이용하는 고객들이라는 점이다. 패스틀리의 CDN에 문제가 생겨 광범위한 접속 장애가 발생한 것이었다.

 

CDN은 전 세계에 있는 서버들의 네트워크를 의미한다. 세계 주요 거점에 콘텐츠가 저장되어 있는 캐시 서버를 설치해 서버와 사용자 간의 물리적 거리를 좁혀 준다. 사용자는 자신과 가장 가까이에 있는 캐시 서버로부터 콘텐츠를 빠른 속도로 끊김 없이 제공받는다.

 

우리가 인터넷을 사용할 때 CDN의 존재를 피부로 직접 느낄 수는 없다. 그러나 우리가 보는 콘텐츠의 상당수는 이미 CDN을 통해 전송되고 있다. 넷플릭스에서 보는 동영상, 아마존에서 보는 상품 이미지, 뉴욕타임즈에서 읽는 기사 글 모두 CDN을 통해 전달받은 콘텐츠들이다.

 

CDN과 같은 인터넷 인프라는 우리 눈에 보이지는 않지만 인터넷이 제대로 동작하려면 꼭 필요하다. 패스틀리 사고에서 보았듯이 인터넷 인프라에 장애가 생기면 광범위한 접속 마비를 일으킬 수 있다. 장애 자체도 문제이지만 더 근본적인 문제가 있다. 바로 인터넷 인프라의 상당 부분이 한 곳에 ‘집중되어 있다’는 점이다.

 

이번 패스틀리 장애 사고는 집중화된 인터넷의 위험성을 여실히 보여주었다. 전 세계의 수많은 웹사이트들이 패스틀리라는 단일 서비스에 집중되어 의존하고 있었다. 인터넷 인프라의 집중화 현상은 이미 다양한 분야에서 일어나고 있다. 대표적으로 클라우드 서비스가 있다.

 

작년 11월 아마존 웹 서비스(AWS)에서 장애가 발생해 수많은 웹사이트와 앱이 일시 중단된 적이 있었다. AWS를 포함해 마이크로소프트 Azure, 구글 클라우드와 같은 업체들은 세계 각지에 여러 데이터센터들을 두어 광범위한 네트워크를 가지고 있다. 전 세계 수천만 명의 인터넷 사용 문제가 소수의 글로벌 클라우드 서비스 업체에 달려 있는 셈이다.

CDN이나 클라우드와 같은 인프라 서비스만의 문제는 아니다. 데이터센터나 인터넷 교환 지점, 해저 케이블 등 인터넷을 구성하는 물리적인 인프라 역시 방대한 네트워크로 연결되어 있다. 물리적인 인프라에 결함이 생길 경우에도 수많은 지역에서 인터넷 중단 사태가 발생할 수 있다.

인터넷의 본질은 ‘분산’이다. 우리가 흔히 인터넷의 핵심 가치로 꼽는 파급력, 성장성, 그리고 회복탄력성은 모두 인터넷이 ‘분산되어 있음’을 기반으로 한다. 그러나 인터넷은 자꾸만 하나의 거대한 집합처럼 변해 간다. 인터넷 인프라의 중추적인 부분들이 통합되고 있다는 것은 매우 우려스러운 일이다. 인터넷 인프라가 집중될수록 내부 결함이나 외부 공격으로 생기는 장애에 회복탄력성을 잃고 취약해진다는 것을 기억해야 한다.