Breaking
사이버 보안(Cybersecurity)
ITIL 사고관리로 조직 내 업무 효율성·생산성 향상시켜야
2019-06-12 10:41:09
유수연
▲엑셀로스가 최근 ITIL 4 버전을 발표했다(사진=ⓒ위키미디어커먼스) 

[라이헨바흐=유수연 기자] IT 인프라스트럭처 라이브러리(ITIL)을 운영하는 영국 정부 합작 법인 엑셀로스(AXELOS)가 최근 최신 버전의 'ITIL 4'를 발표했다. 

ITIL은 IT 서비스 관리 분야에서 가장 널리 인정되는 국제 표준이다. IT 서비스 분야의 우수 사례를 모두 담고 있어 전 세계 기업들로부터 효율성을 인정받고 있다. 현재는 사실상 표준 IT 관리를 위한 고품질의 IT 서비스 제공 지침서로 평가받는다.

조직 내 사고 관리의 중요성

이번 ITIL4는 비즈니스 조직의 IT 기능을 향상시킬 수 있는 보다 유연한 엔드투엔드(단말 장치들 간 통신) 디지털 운영 모델을 제공할 것으로 보인다. 

이에 조직들은 ITIL 4를 논의시 자체 IT 인프라 및 서비스에 영향을 미치는 중단 발생에 대해 프레임워크가 어떻게 진행되는지 고려하는 것이 중요하다. 또한 프레임워크 측면에서, 이 프로토콜은 주로 '사고관리(돌발상황 관리)'라고 불린다.

▲ITIL은 IT 서비스 관리 분야에서 가장 널리 인정되는 국제 표준으로, 고품질의 IT 서비스 제공 지침서다(사진=ⓒ플리커)

그러나 사고관리는 ITIL 4의 맥락과 별개의 문제 관리인 것처럼 오인될 수 있다. 하지만 여기서 말하는 '문제'는 '사고'를 발생시키는 프레임워크의 문제로 정의되며, '사고'은 문제의 결과물에 가까워, 결국 두 가지는 별개로 취급되어서는 안된다. 

특히 이러한 사고들은 조직 내 마련된 특별 구성팀에서 처리되는 경향이 높다. 즉, 해당 사고가 소수의 인원으로 처리될 수 있는 것이 아닌 더 광범위한 조직 문제라는 것을 보여주는 것으로, 회사의 중요한 프로세스에 영향을 미칠 만큼 중대하다는 의미가 된다.

실제로 영국의 IT 거버넌스에 따르면 ITIL 사고관리에는 로깅 및 기록 등의 문제를 해결하는데 필요한 프로세스 등이 포함된다. 최대한 효율적인 방법으로 정상 상태로 복구시키는 것이 주요 목표다. 

조직 전체에 더 이상의 손상이 발생하지 않도록 하는 것으로, 이를 위해 프레임워크는 사고 관리 후 복구가 최대한 빨리 이루어지도록 보장하는 역할을 할 수 있어야 한다. 이와 관련 영국 IT 거버넌스의 루크 어윈은 사고 관리와 문제 관리를 분리하는 것이 필수적이라며, IT를 사용하는 모든 조직에서 지속적으로 문제가 발생할 수 있어 상당한 지연이 나타날 수 있다고 지적했다.

이처럼 모든 조직은 ITIL 사고 관리는 단순히 조직 내 한 명의 사용자에게만 영향을 미치는 것이 아닌, 비즈니스 주요 운영에 막대한 중단을 야기할 수 있는 대규모 문제로 이어질 수 있다는 점을 명심할 필요가 있다. 가령 서비스 중단같은 사례가 발생해 전체 비즈니스의 작업이 완전히 마비될 수도 있으며, 혹은 잘못 구성되거나 오작동돼 특정 서비스에 오류가 발생할 수 있는 것이다.

사고 범주

ITIL 사건 관리에서 사고를 정의할 때는 영향을 받는 측면에 따라 두 가지의 범주로 다시 분류될 수 있다. 

먼저 첫 번째 범주는 '사용자 경험 사고'다. 이러한 유형의 사고는 대부분 단일 사용자에게 영향을 미치는데, 가령 사용자가 비즈니스의 지속적 운영에 필요한 생산물이나 혹은 특정 종류의 작업을 수행하지 못하게 되는 경우다. 작게는 프린터나 컴퓨터 장치 등 하드웨어 고장부터 연결 오류 및 응용 프로그램 오류 등까지 폭넓게 나타날 수 있다.

두 번째는 '기술적 사고'로 사용자 경험 사고와 달리 바로 앞에 닥친 상황을 제대로 인지하지 못할 때가 많다. 이후 철저한 관리와 검사를 통해 결국 IT팀에서 발견하는 것이 대부분으로 컴퓨터 스토리지 과부하 등의 간단한 문제부터 기술적 역량이 요구되는 더 큰 사례까지 다양하다. 특히 작업이 빠르게 돌아가는 조직 환경에서는 더 많이 간과될 수 있어 세심한 주의가 요구된다.

ITIL 사고 관리 절차

사고를 처리 할 때는 프레임워크의 각 응답자가 문제를 해결할 수 있는 단계적 절차를 따라야한다. 일단 먼저 사고가 파악되면, 해당 사고를 분류하는 조직 내 ITIL 사고 관리 서비스 데스크에 기록될 수 있어야 한다. 그리고 잠재적 동향에 대해 사고가 관찰될 수 있어야 하며, 그에 따라 각각의 우선 순위를 정리하는 것이다. 사고 우선 순위는 문제의 영향을 받는 사용자 수에 따라 낮음, 중간, 높음까지 다양하게 책정될 수 있다.

이후엔 서비스 데스크가 즉각적인 수정 사항을 검색, 최대한 복구 시간이 짧아질 수 있는 조사에 착수할 수 있도록 해야 한다. 데스크는 또한 얼마나 빨리 문제를 감지해 즉각적인 해결책을 제시할 수 있는지도 결정해야 한다. 여기서 일부 완료된 수정 프로그램이 존재한다면, 이는 문제 해결로 간주하면 된다.

그러나 데스크에서 더 높은 우선순위를 요구하는 사고라면, 기술자는 문제를 심층적으로 평가해 내부 원인 파악에 주력해야 한다. 이러한 프로세스를 사고 할당이라고 부른다. 

▲ITIL은 IT 서비스 관리 분야에서 가장 널리 인정되는 국제 표준으로, 고품질의 IT 서비스 제공 지침서다(사진=ⓒ플리커)

그리고 일단 사고가 해결되면, 해당 조직은 사고로 인해 업무에 영향을 받은 사용자들을 대상으로 설문을 진행해 사고 관리 프로세스 전체를 평가할 필요가 있다. 이 같은 평가 수행은 서비스 데스크의 업무 역량과 효과에 대한 개선점 여부를 알아보는데 큰 도움이 될 수 있다.

한편, ITIL 사고 관리외에도 ITIL 프레임워크가 중점적으로 다루는 다른 프로세스도 있다. 가령 앞서 언급된 문제 관리와 변경 관리, 서비스 자산 및 구성 관리, 서비스 수준 관리 등으로, 이들 각각의 프로세스는 ITIL 프레임워크가 기술하는 특정 문제를 중심으로 다룬다.

[라이헨바흐=유수연 기자]