Cloud SLA Policy
SLA(Service Level Agreement)
- 정의
- 사용자 서비스 수준 정의
- 서비스 제공자가 사용자에게 제공하는 서비스에 대한 수준을 정의
- 계약 시 약관에 명시하여 시스템에 장애가 발생한 경우에 보상하는 정책으로 사용
구성요소 | 설명 |
---|---|
서비스 수준 관리 지표 (Service Level Metrics) | 서비스 제공 항목별로 정량적으로 파악 |
서비스 목표 수준 (Service Level Objectives) | 지표별 목표치 : 인센티브 부여 |
지표별 최소치 : 패널티 부과 | |
서비스 성과 측정 기준 (Service Level Measurements) | 관리 지표의 정량적 측정 방법 |
측정 구간, 주체, 주기 등 | |
서비스 수준 보고 (Service Sevel Reports) | 측정 서비스 수준에 대한 평가 결과 보고 방법 |
SLA(Service Level Agreement) 단계(PDCA) - 1
서비스 정의(Plan)
- 서비스 현황 및 목표 조사
- SLA 적용 범위 합의
- SWOT 작성
- 서비스 수준 관리
지표 설정(Do)
- 지표 조사
- 관리 지표 선정
- 관리 지표 측정 방법 정의
서비스 목표 수준 설정(Check)
- 관리 지표 시험 측정
- 관리 지표별 목표 및 최소 수준 결정
서비스 평가 방법 설정(Act)
- 패널티 및 보상 수준 결정
- 가격 책정 방식 결정
- SLA 작성 및 정리
SLA(Service Level Agreement) 단계(PDCA) - 2
- Plan : SLA Service Catalog 작성
- 서비스 상세 내용, 목적
- 사용자 및 제공자간 역할, 책임
- 세부 서비스 범위, 내역
- 서비스 H/W, S/W, Data, App, Policy, Standard 등
- Do : 서비스 수준 관리 지표 선정 고려
- 서비스 제공자 및 사용자가 적절히 참여
- 서비스 제공자가 측정, 관리 가능
- 지표 측정 시 데이터 수집 용이
- 적절한 수준의 지표로 달성 가능한 수준으로 선정
- SMART : 서비스 수준 관리 지표 선정
- 지표의 명확성(Specific)
- 측정 가능성(Measurable)
- 실현 가능성(Action-oriented)
- 연관성(Relevant)
- 적시성(Timely)
SLA(Service Level Agreement) 단계(PDCA) - 3
- Check
구분 | 설명 |
---|---|
측정 기준 | 측정 항목에 대한 목적 |
접수된 사용자 Call을 Service Desk에서 1차 처리하여 운영 및 유지보수 담당자의 부담 감소 | |
서비스 목표 | 2차 콜 처리 = 2차 콜 처리 건수의 합 / 1차에서 처리하지 못한 건수의 합 X 100 |
측정 도구 | 서비스 목표 측정 시스템 또는 도구(예 : ITSM) |
측정 기간 | 측정 항목 기간(예 : 매월) |
보고 빈도 | 측정 기간과 동일 |
측정 대상 | 1차에서 처리하지 못한 콜을 기준으로 이관한 건은 접수에서 제외 |
SLA(Service Level Agreement) 단계(PDCA) - 4
- Act
구분 | 설명 |
---|---|
수준 평가 | 정기적으로 서비스 수준 평가 수행 |
평가 범위 및 결과 산정 방법 명시 | |
만족도 조사 | 설문을 통한 정기적 조사 |
결과 관리 | 수준 이하 시 대책을 수립하고 보상과 책임에 대한 사항 명시 |
문제 대응 | 조치 방법 및 책임자 사항 명시 |
사고 조치 | 사고 유형 및 등급, 책임, 의무 명시 |
기간 경과 시 | 일정보다 늦어지는 경우에 대한 조치 방법, 평가 결과 반영 |
Public Cloud SLA
- AWS EC2
- 월별 가동 시간 기준
- 99.0% 이상 ~ 99.95% 미만 : 10%
- 99.0% 미만 : 30%
- 월별 가동 시간 기준
- AZ(Availability Zone)의 장애는 해당 없음
- 고객 입장 : 상당히 불합리
- AWS : Multi-AZ(Multi-Cloud System) 구축 권고
- VM에서의 Down-Time 가능성
- 서버에 대한 유지보수 시간 개념이 없음
- 서비스 사업자가 서버 자원에 대한 평준화 작업을 하는 경우에 성능, 자원 생성 제한을 해소하기 위하여 무 중단 마이그레이션을 하는 중에 장애 발생 가능
- Cloud Service를 제공하는 H/W 장애
'Cloud' 카테고리의 다른 글
8월 16일 클라우드 - Infra Structure (0) | 2022.08.16 |
---|