Publicação

TMEF, TMPR, TMPRS e TMEIS

foto de
Fernando Palma CONTEÚDO EM DESTAQUE

Tempo Médio Entre Falhas (TMEF), Tempo Médio para Reparo (TMPR), Tempo Médio para Restaurar o Serviço (TMPRS) e Tempo Médio Entre Incidentes do Serviço (TMEIS)


Ciclo de Vida Estendido do Incidente

Caros amigo do Portal GSTI, bem vindo a mais um artigo sobre conceitos básicos da #ITIL! Um dos objetivos desta série é focar em temas que geram dúvidas em quem está ganhando intimidade com os processos ou se preparando para o exame.

Desta vez, selecionei as métricas que são usadas para acompanhar os níveis de disponibilidade, confiabilidade e sustentabilidade de serviços. Tais conceitos são citados no livro de Desenho de Serviços da ITIL, predominantemente na gestão da disponibilidade de serviços, mas também citados em gerenciamentos de continuidade e segurança. 

Se você está estudando #ITIL e chegou neste artigo com a intenção de identificar as diferenças entre essas métricas, sugiro que analise por alguns minutos a imagem acima. Ela é uma reprodução do Ciclo de Vida Estendido do Incidente e provavelmente irá esclarecer o foco de cada métrica.

Se você, entretanto, deseja conhecer um pouco mais sobre a definição e uso dos indicadores de TMEF, TMPR, TMPRS e TMEIS, convido para a leitura a seguir. 

O Tempo Médio Entre Falhas (TMEF) - do inglês: Mean Time Between Failures (MTBF)

Quando lembrar desta sigla, lembre-se que é uma métrica que ajuda a mensurar o nível de confiabilidade do serviço. O TMEF, ou MTBF é o tempo médio em que um serviço fica disponível sem interrupção. É medido a partir do momento em que o serviço começa a funcionar, até sua próxima falha. Basta consultar a imagem para visualizar melhor.

Relação do TMEF com a confiabilidade do serviço

O Tempo Médio Entre Falhas contribui para demonstrar a confiabilidade, já que o serviço confiável é aquele que tem a capacidade de se manter livre de falhas. Quanto maior o TMEF (ou MTBF ), maior será a confiabilidade do serviço.

O Tempo Médio Para Reparo (TMPR) - do inglês: Mean Time To Repare (MTTR)

Já esta métrica ajuda a medir a sustentabilidade do serviço. O TMPR, ou MTTR é o tempo médio levado para reparar um serviço de TI após uma falha. O TMPR é medido a partir de quando o serviço falha até que seja reparado. Use a imagem no início do artigo para visualizar esta métrica.

Relação do TMPR com a sustentabilidade do serviço

O Tempo Médio Entre Falhas contribui para demonstrar a sustentabilidade, já que o serviço sustentável é aquele que tem a capacidade de ser mantido rapidamente após a ocorrência de uma falha. Quanto menor o TMPR, maior será a sustentabilidade do serviço.

O Tempo Médio Para Restaurar o Serviço (TMPRS) - do inglês: Mean Time To Restore Service (MTTRS)

Voltando a usar a imagem do ciclo de vida estendido do incidente, podemos reparar que existe uma diferença entre o TMPR, visto no item anterior e o TMPRS.

O Tempo Médio Para Restaurar o Serviço é o tempo médio entre o início do incidente e o momento em que o serviço volta a estar disponível. Não devemos confundir com a métrica TMPR, pois existe uma diferença - que pode ou não ser sutil - entre o momento em que a falha é reparada até o instante em que o serviço já está disponível para ser utilizado pelo usuário.

Relação do TMPRS com a sustentabilidade do serviço

Assim como o TMPR, esta métrica deve ser usada para demonstrar a sustentabilidade, já que o serviço sustentável é aquele que tem a capacidade de ser mantido rapidamente após a ocorrência de uma falha. Quanto menor o TMPRS, maior será a sustentabilidade do serviço.

O Tempo Médio Para Entre Incidentes do Serviço (TMEIS) - do inglês: Mean Time Between Service Incidents (MTBSI)

Esta métrica é usada para medir e relatar a confiabilidade. É o tempo médio entre o início de um incidente e o início de um próximo incidente. O TMEIS pode ser obtido a partir da soma do TMEF + TMRS.

Relação do TMEIS com a confiabilidade do serviço

O Tempo Médio Entre Incidentes do Serviço contribui para demonstrar a confiabilidade, já que o serviço confiável é aquele que tem a capacidade de se manter livre de falhas. Quanto maior o TMEIS (ou MTBSI ), maior será a confiabilidade do serviço.

Teste-se! Veja se entendeu bem as métricas respondendo as perguntas a seguir:

1) O serviço A tem um TMEF de 2 mil horas, enquanto o serviço B de 3 mil horas. Qual deles apresenta o melhor indicador de confiabilidade?

2) No ultimo mês, um determinado serviço reduziu seu TMPR de 04 horas para 03 horas. Este serviço apresentou uma piora ou melhoria?

3) Qual dos serviços apresenta um indicador melhor de confiabilidade: aquele que tem um TMEIS de 500 horas ou o que possui o TMEIS de 400 horas?

Veja formas de calcular todas estas métricas neste outro artigo: Disponibilidade, confiabilidade e sustentabilidade do serviço 

Respostas das perguntas: 1) O serviço B 2) Melhoria 3) O de 500 horas
Outros artigos sobre conceitos básicos ITIL:

Comentários