[인터뷰] "클라우드 덮어놓고 쓰지 마라…'돈 새는 20%' 찾아야"

기자정보, 기사등록일
임민철 기자
입력 2022-07-06 19:20
    도구모음
  • 글자크기 설정
  • 박정호 베스핀글로벌 CMP개발팀장 상무

  • 고객사 2000개 클라우드 관리툴 개발 총괄

  • "미사용 자원 많아…청구 내역 가시화해야"

  • 고객사 비용 이상 탐지로 해킹 피해 줄여

  • "컨테이너 관리, SaaS 통합 최적화 준비 중"

박정호 베스핀글로벌 CMP개발팀장·클라우드AI연구소장(상무) [사진=베스핀글로벌]


클라우드 서비스를 도입해 환경 변화에 빠르고 유연하게 대응하려는 기업이 많아졌지만 제대로 활용하고 있다고 알려진 사례는 드물다. 본지는 클라우드 관리 서비스 사업자(MSP) 베스핀글로벌의 박정호 상무와 인터뷰했다. 박 상무는 실시간 클라우드 사용 현황을 파악해 비용에 대한 이상 징후를 탐지하고 미사용 자원(unused resources)에 대한 비용 낭비를 막는 '클라우드 관리 플랫폼(CMP)' 개발팀을 이끄는 인물이다. 그는 기업이 클라우드를 잘 쓰기 위한 출발점은 조직 내 모든 부서와 구성원이 다루는 전산 자원부터 명확하게 파악하는 것이라고 조언했다.

다음은 박 상무와 일문일답.

-본인과 부서 업무에 대해 소개 부탁한다

"저는 CMP개발팀장과 클라우드 인공지능(AI) 연구소장을 겸하고 있다. CMP개발팀은 '옵스나우(OpsNow)'라는 CMP와 '얼럿나우(AlertNow)'라는 서비스를 만든다. CMP는 사용자가 클라우드 자원과 그 사용료를 편리하게 관리할 수 있게 도와주는 도구다. 지금 CMP 기반 서비스로 제공하는 기능이 200여개다. 사람이 만든 로직(logic)으로 구현된 기능들인데 이 가운데 많은 부분이 더 효율적인 AI 기반 기능으로 대체될 것이다. AI에 집중해서 클라우드를 더 효율적으로 관리하는 기술을 만들기 위해 클라우드AI연구소를 설립하게 됐다."

-베스핀글로벌 CMP가 얼마나 활용되나

"삼성전자를 비롯한 국내·외 2000여개사가 쓰고 있다. SK텔레콤을 포함해 약 20곳은 화이트레이블(white label) 솔루션으로 도입해 사업을 하고 있다. 국내에 클라우드 MSP가 수백 개 있는 게 아닌데 이미 스무 곳 정도 기업이 옵스나우를 화이트레이블로 도입했다는 것은 그만큼 이 솔루션의 시장 저변이 넓다는 뜻 아닐까. 국내 클라우드 사용량 3분의 1 정도가 옵스나우 기반으로 처리되고 있을 것으로 추산한다. 사용량이 늘수록 클라우드를 제대로 관리하기 위해 옵스나우와 같은 CMP를 필수적으로 사용해야 한다."

-CMP는 어떤 기업에 필요한가

"한 조직이나 기업이 클라우드를 처음 쓰기 시작했다면 사용자 계정 한두 개로 월간 수십만~수백만원어치를 결제하는 수준일 것이다. 이런 규모는 (CMP를 안 써도) 문제가 안 된다. 사용량이 늘어 월 사용 금액이 4000만~5000만원쯤 되기 시작하면 얘기가 달라진다. 클라우드를 써서 운영하는 서비스가 잘 돼서 사업 담당하는 부서에 사람이 늘고 팀이 서너 개 생기면 계정 하나에 몰아 쓰던 자원과 비용 내역을 (부서별 예산을 배정하기 위해 각 사용 주체별 여러 계정으로) 나눠 줘야 한다."

-비용을 분석하는 건 사람이 할 일 아닌지

"이 총액이 나오기까지 '언제', '무엇을', '얼마나' 썼는지 보여 주는 과금 세부 내역이 있다. 분량이 100만 줄을 넘는다. '엑셀'로 열어볼 수 없는 데이터가 된다는 얘기다. 사람이 100만 줄이 넘는 항목을 가지고 '누가 언제 뭘 썼고 누구는 언제 뭘 썼다' 이렇게 일일이 분석할 수 없다. 그리고 비용 처리 업무라는 이유로 재무부서나 경영관리팀 담당자가 이 과금 내역 배분을 맡더라도 개발팀이나 엔지니어에게 (분석된) '내역을 뽑아 달라'고 요청할 게 아닌가. 그럼 개발팀은 '이 사람이 무슨 얘길 하고 있나'할 거다."

-사용 내역이 방대해서 문제란 얘긴가

"어떤 거대한 서비스를 구성하는 모든 클라우드 자원을 계정 하나만으로 관리할 수는 없다. 한 서비스에서 어떤 부분은 A계정, 어떤 부분은 B나 C계정으로 관리되는 자원을 쓸 수 있다. 각 계정 사용자들이 같은 회사 동료라고 해도 다른 부서나 계정이 어떤 자원을 쓰고 있는지 서로 알기 어렵다. 담당자가 여러 번 바뀌면 계정 하나의 이력도 관리가 안 된다. 지금 돌아가고 있는 서비스에 이 계정의 어떤 자원이 정말 필요한지 없애도 되는지 아무도 모르게 된다는 얘기다. 우리는 클라우드를 몇 년 쓴 회사에 이런 '미사용 자원'이 평균적으로 20% 정도는 깔려 있다고 본다."

-기본 관리 도구에 실시간 현황이 있을 텐데

"기본 관리 도구로 기업 단위 자원 현황을 보고 사용량을 추적하거나 집계하는 일을 할 수는 있다. 그런데 클라우드 사업자가 제공하는 관리 기능은 철저하게 계정 단위로 구성돼 있다. 계정 수만큼 사용자가 로그인해서 조회하고, 정리하고, 내려 받아야 한다. 그리고 통합해서 보려면 엑셀에 붙여 넣어 합쳐야 하는데 아까 말했듯이 100만 줄을 넘어가면 파일을 못 연다. 이런 데이터를 다루는 툴이 엔지니어에게 제공되지만 재무담당자가 그걸 공부해서 쓸 수 있을까. 불가능하다. 개발자한테 가서 또 '이런 저런 데이터를 달라'고 할 것이다."

-CMP가 구체적으로 어떤 일을 해 주나

"옵스나우는 기업이 쓰는 클라우드 자원에 대한 비용을 원하는 형태로 보여 준다. 분석해야 하는 청구 내역 분량이 100만 줄이든 1000만 줄이든 봐야 하는 사용 기간이 두 달이든 세 달이든 이걸 월단위나 일단위 트렌드로 확인할 수 있다. 회사 전체 계정 내역을 통합해서 여러 계정을 쓰는 한 부서 현황으로 묶거나 한 계정을 여러 담당 부서에 올로케이션(분배)하는 과정을 거쳐 실제 '부서별 비용'도 확인할 수 있다. 클라우드 사업자 할인 혜택으로 차감된 비용을 여러 기준에 따라 부서별로 동등하게 반영하고 최적화하는 기능도 제공한다."
 

박정호 베스핀글로벌 CMP개발팀장·클라우드AI연구소장(상무) [사진=베스핀글로벌]


-고객사 보안 사고 피해도 줄여 줬다고 들었다

"원래 CMP에 고객사가 직접 기준을 설정해 놓고 비용이나 자원 사용량에 이상이 발생하면 연락이 오게 하는 '리소스 알람(alarm)' 기능이 있다. 우리도 이 기능으로 사고 예방 차원에서 고객사와 비슷한 기준으로 내부 모니터링을 하고 있다. 올 상반기에 중동 지역의 한 고객사 환경에서 해킹으로 의심되는 자동 리소스 생성이 탐지됐다. 비용이 시간당 1000~1500달러씩 불어났다. 휴일 새벽 시간대라 고객사와 연락하는 데 시간이 다소 걸렸지만 담당 엔지니어를 통해 확인해 보니 역시 해킹이었다. 해킹 5시간만에 조치를 시작해 비교적 적은 피해로 마무리됐다."

-해커가 클라우드를 해킹한 목적은 뭐였나

"수집된 데이터로 고객사 클라우드 영역에 생성된 자원을 조사해 보니 해커가 암호화폐 '이더리움'을 채굴하기 위해 오픈소스 스크립트를 악용한 사례였다. 클라우드에 고객사 허가를 받지 않은 이더리움 채굴 서버 수백 대가 스크립트로 자동 생성돼 몇 시간 동안 가동됐다. 우리가 이걸 탐지하고 고객사가 이 자원을 삭제하는 등 조치를 했을 땐 이미 몇 시간 동안 어느 정도 수익을 거둔 상태였다. 우리 고객사뿐 아니라 일본 도쿄, 인도 뭄바이, 싱가포르, 영국 런던, 미국 오리건 등 각지에서 동시 다발적으로 피해가 발생했다."

-그런 해킹을 어떻게 탐지했나

"회사마다 주로 쓰는 리전(region)이 있다. 이 중동 지역 고객사가 서비스를 하지 않는 인도나 남아프리카공화국 등에 있는 리전을 갑자기 쓸 이유가 없는데 이번 해킹 때 그런 리전에 많은 자원이 생성됐다. 평소 안 쓰는 리전이 선택되고 고가 하드웨어 장비가 한 번에 100대, 200대 생기는 것으로 기존 패턴을 벗어난 이상이 발생했다고 알람이 왔다. 우리는 클라우드 자원 생성 상황을 5분마다 탐지해서 이 간격이 지나야 알람을 받지만 고객사가 알람 기능을 직접 사용하면 먼저 알고 더 빨리 대응할 수 있다. 기업이 직접 알람을 사용해 이런 경우에 대비했으면 좋겠다."

-국내에도 비슷한 일이 있었나

"해외뿐 아니라 국내에서 어뷰징이 탐지되는 경우가 적지 않다. 개발자와 엔지니어가 클라우드 접근 권한을 아무리 철저하게 관리해도 침해 사고는 계속 발생한다. 6월 중에만 고객사에서 두 차례 비슷한 사고가 발생했다. 옵스나우가 실시간 이상 자원 생성을 탐지하고 업무 관련자들에게 문자, 전화, 카카오톡, 슬랙 등을 통해 즉각적으로 알람을 전파해 피해를 최소화했다. 옵스나우와 같은 CMP를 사용하면 해킹을 당했을 때 사전 예방과 빠른 조치로 피해를 최소화하고 클라우드를 제대로 관리할 수 있다."

-해킹을 제 때 알아차리지 못했다면

"기업이 클라우드 서비스에서 실시간 자원 사용량으로 탐지하지 못한 이상 비용은 24시간이 경과해 발행되는 '빌링 리포트(billing report)'를 봐야 나온다. 일반적인 보안 기술이나 이상 탐지 활동으로 발견하려고 해도 3~4일 지난 뒤에야 알게 되는 경우가 많다. 중동 고객사 사례의 누적 피해 규모는 5시간 동안 1만 달러 정도였으니까 만 하루가 지났다면 4만~5만 달러로 늘고 3~4일이 경과했다면 곧 20만 달러까지 클라우드 비용이 추가 청구됐을 것이다. 해킹 피해 액수가 크면 기업이 구제를 신청해도 클라우드 서비스 사업자로부터 환불을 받기 어렵다."

-AI 기술이 이상 탐지에 쓰이나

"클라우드AI연구소는 베스핀글로벌의 경험과 지식을 바탕으로 주로 비용 변화에 대한 예측 모델과 이상 비용·자원·권한을 탐지하는 AI를 만들어 제공하고자 한다. 특히 클라우드 관리 환경에서 권한 설정이 중요하면서 어려운 부분이다. 각 상품, 사용자 계정, 회사마다 설정 가능한 권한이 있고 권한을 가질 수 있는 주체가 복잡하다. 어떤 클라우드 기반 스토리지 서비스에 대한 '읽기 권한'을 달라는 외부 요청은 대수롭지 않아 보여도 특정 자원, 경로에 대한 조건 없이 이 권한을 주면 상대가 서비스에 저장된 모든 내용을 다 볼 수 있게 돼 큰일 난다."

-AI를 활용하면 관리 업무가 어떻게 바뀔까

"AI는 결국 자동화다. 기업이 클라우드에서 더 많은 계정과 자원을 간편하게 다루고 비(非) 전문가도 클라우드를 관리할 수 있게 될 것이다. 이게 우리가 옵스나우를 개발하면서 추구하는 방향이다. 특히 AI가 권한 관리를 자동화하거나 이상을 탐지해서 보안담당자와 운영담당자를 괴롭히는 보안 그룹 설정, 태깅(tagging) 등 단순 반복 업무를 덜어 주면 인적 오류(human error)를 많이 줄이고 전문가들이 각자 원래 역할에 집중할 수 있다. 비용 관리 때문에 재무담당자가 클라우드를 공부하거나 운영 담당자가 재무를 알아야 할 필요도 없어진다."

-향후 CMP 개발 방향과 AI 연구 목표는

"클라우드 자원을 가상머신 서버보다 더 클라우드 특성에 맞게 관리하고 최적화하려는 기업을 지원하기 위해 도커나 쿠버네티스같은 컨테이너 관리 시스템을 기반으로 구축하고 운영하는 환경을 지원하려고 한다. 이에 대해 자원 현황을 시각화하고 자원 담당 주체를 배정하고 청구되는 비용을 최적화하는 기술이 필요하다. 또 그간 클라우드 인프라 비용에 주로 초점을 맞췄다면 앞으로 업무 솔루션으로 다양하게 도입될 서비스형 소프트웨어(SaaS)의 월간, 일간 비용을 묶어 관리할 수 있도록 지원해 달라는 요구에도 대응할 계획이다."

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
실시간 인기
기사 이미지 확대 보기
닫기