필자는 KT 인터넷을 사용중이다. KT 인터넷은 해외망이 튼튼하고 안정적이라고 널리 알려져 있었다. 하지만 최근 들어 그 명성이 무색해진 듯하다. 특히 아침과 밤 시간대에는 네트워크가 불안정해 자주 접속 문제가 발생한다.
어떤 일이 있었나?
작년 말부터 Cloudflare, Fastly 등의 CDN을 사용중이며 ICN 리전을 사용하지 않는 사이트에 접속할 때 로딩 시간이 비정상적으로 길어지는 현상이 나타났다. 예를 들어, 아침 시간대에는 트위터(Fastly 대만 리전)에서, 밤 10시 30분부터 새벽까지는 Cloudflare를 사용하는 해외 사이트 전반에서 접속 지연이 발생했다.
과거에도 비슷한 문제가 있어 KT에 문의한 적이 있다. 당시에는 애플의 iOS 업데이트로 일본 특정 ISP 회선이 원활하지 않다는 답변을 받았다. 이번에도 iOS 업데이트 시점부터 문제가 심화되었지만, 업데이트 시즌이 끝난 후에도 해외망 상태는 개선되지 않았다. 필자는 개발 관련 사이트에 자주 접속하는데, 이들 사이트는 대부분 Cloudflare를 사용한다. 따라서 이 시간대에는 사실상 개발 업무가 불가능할 정도로 불편했다.
트위터(X) 사진이 표시되지 않는다.
트위터는 웹은 Cloudflare를, 이미지 등의 CDN은 Fastly를 사용한다. 웹은 Cloudflare의 ICN 리전에 연결되므로 접속이 비교적 원활하나 CDN의 리전은 일본이므로 사진이 매우 늦게 뜨는 문제가 발생한다.
아래는 트위터가 사용하는 pbs.twimg.com으로 오전 11시경에 MTR을 측정한 데이터이다.오사카 부근 홉에서 80%의 Loss가 발생하는 것을 확인할 수 있다.
마인리스트 접속이 불가능하다.
필자는 마인크래프트 서버 목록 서비스인 마인리스트를 운영 중이다. 마인리스트는 보안과 최적화를 위해 Cloudflare를 사용하지만, 비용 문제로 대한민국의 ICN 리전을 사용하지 않는다. 따라서 대부분의 사용자는 일본 Cloudflare 리전에 접속하게 되는데, 해외망이 혼잡해지면 일본 리전 접속이 어려워진다. 1
결국 대부분의 사용자가 일본에 위치한 Cloudflare 리전으로 접속하게 되는데, 해외망이 혼잡해지면 일본 리전의 접속이 어려워진다.
예를 들어, 위 이미지에서 패킷 손실률이 14%에 달하며, 사이트 접속 시 몇 분이 지나도 로딩이 완료되지 않는 경우가 빈번했다. 이 글을 작성하는 동안에도 로딩이 끝나지 않았다.
마인리스트가 아닌 Cloudflare를 사용하는 일부 사이트들도 접속이 당연히 원활하지 않다. 해외 사이트들도 한국에서 ICN 리전을 사용하려면 엔터프라이즈 요금제를 써야 하는데, 이미 외국에서는 엔터프라이즈를 쓰지 않아도 가까운 리전으로 연결되는데 굳이 한국인들만을 위해서 비싼 돈을 들여서 엔터프라이즈 요금제를 도입해 줄 리도 없다.
KT와 Cloudflare의 입장은?
KT는 과부하 시간대에는 인터넷 사용을 피하라는 다소 황당한 답변을 내놓았다.
KT~Cloudflare간 회선에서 출력(KT -> Cloudflare)은 양호하나, 입력(Cloudflare -> KT) 일부시간대에 과부하가 발생하는 것으로 확인됩니다.
현재 트래픽 사용량이 많은 최번시에는 과부하가 발생하므로 안정적인 사용을 위해서는 1시~15시 사이에 사용하시길 권고드립니다.
(코넷 국제회선은 모든 고객이 공용으로 사용하는 회선이며, 트래픽 사용량이 많은 시간대에는 신뢰성이 보장되지 않습니다.)
— KT IP운용센터
반면, Cloudflare는 문제의 원인이 KT에 있다며 ISP에 문의하라고 답변했다
It's the ISP that is shaping or purposely bottle-necking you, not Cloudflare, otherwise the use of WARP or a VPN would not resolve the issue, but it does.
Please contact the ISP and request a solution from them.
문제를 일으키거나 의도적으로 병목 현상을 일으키는 것은 Cloudflare가 아니라 ISP입니다. Cloudflare의 잘못이었다면 WARP나 VPN을 사용해도 문제가 해결되지 않아야 하지만, 실제로는 해결되니까요.
ISP에 연락해서 해결책을 요청하십시오.
— Cloudflare
QUIC를 해제하면 문제가 완화되기는 한다.
혹시나 해서 Cloudflare의 QUIC(HTTP 3) 옵션을 꺼 보았다. 사이트가 비교적 원활하게 접속되는 것으로 보인다. 여기서 "비교적"이라는 것의 설명은 평소보다 지연이 더 생기기 때문이다.
QUIC는 UDP를 기반으로 작동하는데, 해외발 네트워크 공격이 UDP를 자주 사용한다는 점을 고려할 때, KT가 UDP 트래픽에 제한을 걸었을 가능성이 있다. 이로 인해 QUIC 프로토콜이 영향을 받은 것으로 추정된다.
하지만 정확한 원인은 불분명하다. QUIC의 혼잡 제어(Congestion Control) 문제일 수도 있고, KT의 UDP 제한 때문일 수도 있다. KT의 공식 입장은 단순히 "회선 과부하"라는 답변뿐이다.
그리고 QUIC는 국제 표준 프로토콜로 채택되어 HTTP/3 이라 불리고 있으며, 점점 더 많은 사이트에서 채택되고 있으므로 QUIC 비활성화는 임시 해결책에 머물 수밖에 없다.
특정 지역에서 한정된 것은 아니다
필자는 전북과 서울의 KT 망을 사용하고 있다. 문제 발생 시간대에 MTR을 사용하여 패킷 Loss를 측정해 보았더니, 큰 차이가 없다.
결론
다른 통신사를 쓴다고 문제가 해결될까? SKB의 해외망이 불안정하다는 것은 누구나 다 아는 사실이다. 유플러스도 특정 시간대에 해외망이 죽는건 마찬가지이다. 게다가 사용자들에게 "KT 말고 다른 통신사를 쓰라"고 강요할 수는 없다.
결국 KT의 해외망 확충이 근본적인 해결책인데, 최근 KT의 답변에서는 문제 해결 의지가 부족해 보인다. 몇 년 전만 해도 달랐다. 2
답답하다.
5WHYS
- 왜 해외 사이트 접속이 잘 되지 않을까?
해외 사이트와 KT의 통신이 불안정하기 때문이다. - 왜 해외 사이트와 KT의 통신이 불안정한가?
KT가 해외망 회선을 확보하지 않았기 때문이다. - 왜 해외망 회선을 확보하지 않았을까?