한국클라우드컴퓨팅연구조합 > 산업뉴스 > [디지털타임스] [주간 클라우드 동향] 도마 위 오른 퍼블릭 클라우드 안정성

한국클라우드컴퓨팅연구조합에 오신것을 환영합니다.

작성일 : 17-03-09 16:15

[클라우드컴퓨팅] [디지털타임스] [주간 클라우드 동향] 도마 위 오른 퍼블릭 클라우드 안정성

글쓴이 : 최고관리자

http://www.ddaily.co.kr/news/article.html?no=153478 [1898]

[주간 클라우드 동향] 도마 위 오른 퍼블릭 클라우드 안정성

백지영 기자 jyp@ddaily.co.kr
[2017.03.06.]

지난주 아마존웹서비스(AWS) 미국 동부-1(us-east-1) 리전의 S3(스토리지 서비스) 장애가 발생해 다수의 서비스(웹사이트)가 다운되는 사태가 벌어졌습니다. 업체마다 다르지만, 이번 장애는 최대 11시간 지속된 것으로 전해지는데요. 넷플릭스와 레딧, 어도비, 핀터레스트, 에어비앤비, 룰루레몬 등의 사이트가 제대로 작동하지 않은 것으로 전해집니다. 이번 서비스 장애가 처음도 아니지만, 최근 클라우드 업계에서 AWS의 위상을 생각하면 쉽게 넘길 일은 아닙니다.

AWS은 이번 장애의 원인을 개발자의 오타(Typo)라고 해명했습니다. S3 서비스의 과금 시스템이 느리게 진행되는 문제를 해결하는 과정에서 명령어를 잘못 입력해 여러 대의 서버가 삭제되면서 장애로 이어졌다는 것입니다. AWS의 개발자도 인간인지라 누구든 할 수 있는 실수입니다. 다만 AWS가 현재 인터넷 세계에서 미치는 영향력이 너무 커지면서 파급력이 너무 큰 것이지요.

비단 클라우드 서비스 뿐만 아니라 자체 데이터센터를 운영하고 있는 기업들 역시 무수한 서비스 장애와 직면합니다. 오히려 AWS과 같은 퍼블릭 클라우드 서비스보다 더 자주 발생할지도 모릅니다. 잘 알려지지 않아서 모를 뿐이지요. 하지만 이 경우엔 상황을 파악해서 조치를 취할 수 있지만, 퍼블릭 클라우드 서비스를 이용할 경우, 기업들은 AWS가 문제를 파악하고 이를 해결할 때까지 마냥 기다려야만 합니다. 결국 AWS에 대한 의존도가 커질수록 리스크도 커지는 셈입니다.

이를 위해 AWS는 항상 여러 리전에 분산 저장할 것을 권고하고 있습니다. 심지어 AWS도 인프라 상태를 모니터링해서 알려주는 서비스 헬스 대시보드도 미국 동부-1 리전에서 운영되는 바람에 제대로 동작하지 않았습니다.

또 이번 장애를 교훈삼아 AWS의 내부 툴과 프로세스 절차를 바꿨다고 밝혔습니다. 세이프가드 기능을 추가해 서브시스템의 최소 필요 용량 밑으로 제거되는 것을 방지하는 등 조치를 취했다고 합니다. 하지만 AWS를 사용하고 있거나 사용할 예정이었던 기업 입장에선 퍼블릭 클라우드 서비스의 안정성에 대해 재고하는 계기가 됐을 것 같습니다. 반대로 마이크로소프트(MS)나 구글 등은 아주 좋아했을 것 같네요.

한편 국내에선 네이버비즈니스플랫폼(NBP)의 클라우드 보안 인증이 이슈가 됐습니다. 네이버의 IT인프라 운영 자회사인 NBP는 지난해 정부의 클라우드 보안 인증을 신청, 2월 말 인증을 획득했다고 하는데요.

NBP는 자사 클라우드 서비스의 안정성을 객관적으로 검증하기 위한 차원이라고 했지만, 관련 업계에서는 공공(정부) 클라우드 시장은 물론 본격적인 사업을 시작하는 것으로 파악하고 있습니다. 다크호스로 떠오른 NBP의 클라우드 사업이 국내 클라우드 업계에 어떠한 영향을 미칠지 주목됩니다.

<중략>