
유튜브, 챗GPT, 배달의민족, 가상자산 거래소 업비트 등 주요 온라인 서비스가 잇달아 접속 장애를 일으키면서 그동안 일반 이용자에게는 다소 생소했던 기업이 전 세계적 주목을 받게 됐다. 바로 미국의 웹 인프라 기업 클라우드플레어(Cloudflare)다. 이 회사의 시스템 오류가 발생한 것은 지난달 중순 대규모 장애 이후 약 2주 만으로, 당시에도 글로벌 주요 플랫폼이 6시간가량 정상적으로 작동하지 못했다.
클라우드플레어의 장애가 세계 곳곳의 서비스 중단으로 이어지는 이유는 단순하다. 전 세계 인터넷 트래픽의 약 20%가 이 회사를 통과하기 때문이다. 영국 인디펜던트는 “인터넷의 상당 부분을 조용히 떠받쳐 온 기업이 올해 들어서야 대중적으로 알려지기 시작했다”고 전했다.
샌프란시스코에 본사를 둔 클라우드플레어는 빠른 웹 접속과 보안 기능을 제공하는 클라우드 솔루션 기업이다. 이들이 제공하는 핵심 서비스는 **콘텐츠 전송 네트워크(CDN)**로, 이용자와 물리적으로 먼 서버 사이의 거리로 인해 발생하는 지연 현상을 최소화하는 역할을 한다. 해외 쇼핑몰, 글로벌 게임, 실시간 스트리밍, 생성형 AI 서비스 같은 고트래픽 환경에서 필수적인 인프라다.
예컨대 서울에서 미국 서버 기반 쇼핑몰을 접속할 경우, 데이터를 미국에서 직접 받아오게 되면 속도가 현저히 떨어진다. 이런 문제를 해결하기 위해 CDN은 전 세계에 분산된 서버를 통해 이용자에게 가장 가까운 지점에서 데이터를 전달한다. 클라우드플레어는 330여 개 도시에 구축한 데이터센터를 기반으로 이러한 기능을 수행하고 있으며, 지난해만 해도 초당 6,300만 건 이상의 HTTP 요청을 처리했다고 밝힌 바 있다.
특히 생성형 AI는 막대한 데이터를 주고받는 과정에서 CDN의 성능이 서비스 품질을 결정짓는 핵심 요소로 떠오르고 있다. 실제로 챗GPT 장애 역시 이 CDN 의존 구조가 흔들리면서 발생한 것으로 분석된다.
문제가 되는 부분은 전 세계 인터넷 생태계가 소수 기업에 지나치게 의존하고 있다는 구조적 취약성이다. CDN 시장의 경우 클라우드플레어, 아카마이, 아마존웹서비스(AWS)가 전 세계 시장의 약 90%를 점유하고 있다. 이 중 한 곳에서 문제가 발생하면 웹사이트, 스트리밍, 쇼핑몰, 게임, 금융, 교통 시스템까지 동시적으로 마비될 수밖에 없는 구조다.
실제로 이런 사례는 반복되고 있다. 지난해 7월에는 보안기업 크라우드스트라이크의 업데이트 오류로 전 세계 병원·은행·공항 시스템이 멈춰 섰다. 당시 델타항공은 5,000편 이상의 항공편이 결항되며 약 5억 달러(6,800억 원)의 손실을 입었다. 지난 10월에는 AWS와 마이크로소프트(MS)의 장애로 다수 온라인 서비스가 일시 중단되기도 했다.
전문가들은 이러한 문제를 단순한 “불편함” 수준으로 치부할 수 없다고 지적한다. AI 기반 서비스가 업무·은행·공공 서비스·쇼핑 등 실생활 전반으로 확산하면서 네트워크 장애는 곧 생활·경제 기능의 정지와 같은 의미가 되기 때문이다.
미국 NSA 출신 연구원 마이클 채플 노트르담대 교수는 “20년 전에는 IT 서비스가 일주일에 한 번 내려가도 큰 문제가 아니었지만 지금은 기업과 공공 인프라가 소수의 클라우드 기업에 집중돼 있어 장애가 확산될수밖에 없다”고 CNN 인터뷰에서 설명했다.
결국 이번 사태는 전 세계 디지털 생태계가 소수 인프라 회사에 지나치게 집중된 구조를 그대로 둘 경우 동일한 문제가 반복될 수밖에 없다는 경고로 받아들여야 한다는 목소리가 커지고 있다. 디지털 전환이 가속화될수록 “인터넷을 지탱하는 보이지 않는 기둥들”에 대한 점검과 다변화가 필수 과제로 떠오르고 있다.