본문 바로가기
카테고리 없음

SLA 필요성 도입절차 및 지표에 대한 사례

by ♡42245♡ 2022. 10. 9.
반응형

SLA는 서비스 제공업체의  IT Service Level을 정량적으로 측정하고 평가할 수 있도록 사용자와 상호 동의하는 문서입니다. 서비스를 제공받는 업체는 아웃소싱 업체 선정 시 기술적 능력과 서비스 수준을 가늠할 수 있는 기준으로 활용할 수 있습니다. 이 글에서는 SLA 필요성과 도입 절차 그리고 서비스 지표 사례를 정리해보겠습니다.

SLA (Service Level Agreement)

필요성

SLA는 IT 서비스 수준을 계측가능한 수치로 정량화하는 상호 협의 문서입니다. SLA 협의서 없다면 다음과 같은 문제가 발생할 수 있습니다.

  • IT 공급업체 위주의 리포트에 따른 사용자의 불만 발생
  • IT 서비스 아웃소싱시 평가 기준이 모호
  • IT 서비스 제공 업체의 수준과 이를 측정 가능한 지표가 없어 상호 비교가 불가능

IT 서비스를 제공받는 측에서는 SLA를 통해 업체의 운영방식과 서비스 레벨 관리능력을 측정할 수 있습니다. 그리고 서비스 수준의 유지 및 측정 솔루션의 보유 여부를 보고 업체의 기술능력을 판단하는 지표로 활용합니다.

구성요소

SLA 협의서를 작성할 때는 기술적 측면과 관리적 측면을 고려하도록 합니다.

 

기술적 측면 서비스 매트릭스의 효과적인 측정을 위해 적절한 기술적 도구를 설정합니다. 가령 다음의 항목에 대해 측정 가능해야 합니다.
  • 가용성, 만족도, 정확도, 응답도
관리적 측면 기술적 지표 이외에도 성과의 추적과 보고, 이슈관리, 보안관리 등의 측면에서 평가 가능해야 합니다.

서비스내용

IT 서비스의 방법 구간 및 제공하는 세부 내용 그리고 범위에 대해 명시합니다. 이를 위해  서비스 레벨 목표를(SLO) 명시합니다. 

영향범위

가령 장애의 발생 시 서비스의 복구 시간과 복구 범위 등에 대한 영향을 명시하여 고객이 받을 수 있는 영향의 범위를 명시합니다.

구성 형태

서비스 구축 시 하드웨어, 소프트웨어, 네트워크 및 보안 등의 설계, 레이아웃 그리고 기술요소 등을 명시합니다.

목표기준 및 보상

서비스 레벨 목표에 근거하여 제공하는 서비스의 목표치와 미 준수시 보상할 금액과 산정기준 등에 대해서 명시합니다.

측정방법

서비스 수준을 측정할 수 있는 세부적인 도구와 측정방법을 명시합니다. 이를 명확히 하지 않으면 운영상황이나 시스템에 따라 오차범위나 허용기준이 달라질 수 있기 때문입니다.

SLA 도입절차

서비스레벨 지표를 도입하기 위해서는 다음과 같은 절차로 도입을 진행합니다.

SLA 도입절차 4단계

1. 서비스 범위 및 내용 정의

IT 서비스의 세부 요구사항을 문서화합니다. 요구사항을 통해 서비스 제공자는 필요한 개발 일정과 리소스에 대한 판단 근거자료가 됩니다. 소프트웨어 대가 판정은 크게 기능점수와(FP) 투입공수 방식으로 구분할 수 있습니다. 관련한 내용은 다음의 글을 참고 바랍니다.

2. 서비스 수준 관리 지표 선정

서비스 지표를 조사하여 관리대상으로 삼을 지표를 선정합니다. 해당 관리지표에 대해 측정방식을 정의합니다. 지표에 대한 사례는 아래에서 다시 살펴보겠습니다.

3. 서비스 목표 수준 설정

서비스 제공자와 사용자 간에 관리 지표별 목표와 최소 수준의 서비스 리벨을 설정하는 단계입니다. 각 지표의 시험측정을 통해 상호 합의를 통해 Level을 결정합니다.

4. 페널티 보상기준 결정

만약 자체적인 결합에 의해 상호 합의한 서비스 수준에 미달할 경우의 보상 방식과 페널티 등에 대해 결정합니다. 이에 대한 협의를 모두 마치게 되면 최종적으로 SLA를 작성하여 상호 교환합니다. 

 

SLA를 통해 정형화된 품질 및 성과분석이 가능하며, Service Level을 지속적으로 개선할 수 있습니다. 또한 SLA는 향후 서비스 수준 관리의 (SLM) 지표로 활용할 수 있습니다. 

SLA 지표 사례

SLA 지표는 하드웨어, 소프트웨어, 네트워크 서비스 수준으로 나눌 수 있으며, 자세한 사례는 다음과 같습니다.

  • 서비스 가동률: 서비스 시간 동안 제공 가능한 가용성 목표를 백분율로 나타냄

1- (장애시간/서비스 시간) %

  • 동일 장애 발생률: 기 발생한 장애와 동일 장애 재발의 비율을 나타낸다.
  • 소프트웨어 장애 및 오류 건수 또는 오류 처리율
  • 네트워크 가동률
  • 서비스 데스크 1차 처리율

 


이상으로 SLA 필요성 도입절차 및 지표에 대한 사례에 대해 알아보았습니다. 관련한 다른 글은 다음을 참고 바랍니다.

 

반응형

댓글