Um acordo de nível de serviço (SLA) é um contrato legalmente aplicável entre um provedor de serviços e seus clientes. O TI documenta o nível de serviço esperado do provedor de serviços e descreve as expectativas e os requisitos do cliente. Um SLA define as métricas pelas quais a qualidade dos serviços é medida, as penalidades que podem ser incorridas caso os níveis de serviço acordados não sejam alcançados e as resoluções para quaisquer falhas do SLA.
As penalidades para uma empresa resultantes de falhas de SLA podem ser altas. O tempo de inatividade tem um impacto significativo no resultado final de uma empresa, incluindo custos de mão de obra mais altos, perda de clientes, perda de receita e a possibilidade de pagar multas de SLA, o que faz com que seja uma métrica importante a ser monitorada e observada. Uma pesquisa da ITIC descobriu que o custo por hora das métricas de SLA comumente medidas, como o tempo de inatividade, pode exceder US$ 300.000 para 91% das PMEs e grandes empresas.
Os SLAs são um componente crucial para qualquer empresa, mas especialmente para parcerias entre clientes e provedores de serviços na esfera tecnológica. Eles podem ser projetados para dar suporte a ambas as partes nessas parcerias. No entanto, os SLAs padrão fornecidos pelos prestadores de serviços geralmente são genéricos, aplicados de forma ampla a todos os seus clientes e, às vezes, podem ser unilaterais. Portanto, as empresas precisam contratar consultores jurídicos para garantir a inclusão de interesses específicos do cliente em um SLA, por exemplo, cláusulas de escape.
Há três tipos principais de SLAs: corporativo, de cliente e de serviço. Eles podem ser combinados para criar acordos de vários níveis.
Um SLA corporativo define o nível de serviço para requisitos comerciais específicos, como segurança, em uma organização. Um SLA baseado no cliente descreve os serviços que um cliente específico, por exemplo, o departamento financeiro de uma organização, pode usar. Um contrato baseado em serviço cobre um único serviço, por exemplo, o uso de um aplicativo, fornecido por um provedor de serviços a um cliente ou corporação. A maioria das organizações usa vários tipos de SLAs para criar uma estrutura de SLA multinível ou hierárquica.
Os serviços podem ser fornecidos por provedores externos ou internamente entre departamentos de uma organização. Por exemplo, o departamento de TI de uma organização pode elaborar um SLA entre ele e outro departamento para fornecer hardware e serviços de suporte.
Um objetivo de nível de serviço (SLO) é um acordo em um SLA sobre uma métrica específica e quantificável, como disponibilidade do sistema ou tempo de resposta. Um SLO define as métricas do SLA, por exemplo, que o tempo de atividade deve ser de 99,99%.
Os SLAs são usados externamente para definir um acordo entre as duas partes. Os SLOs são objetivos que são medidos internamente para avaliar se um benchmark de SLA está sendo cumprido. Os SLOs são rastreados por meio da medição de indicadores específicos de nível de serviço (SLIs).
Um SLI mede a conformidade com um SLO. Um SLI é uma medida interna que fornece métricas reais para comparação com o SLA. Por exemplo, se o nível de tempo de atividade for especificado como 99,99% e o tempo de atividade real, o SLI, for de 99,5%, isso significa que o nível de serviço acordado não foi cumprido.
Ao contrário dos SLAs, os SLOs não têm consequências contratuais, que são penalidades que ocorrem quando os benchmarks especificados em um SLA não são cumpridos. Os SLAs são legalmente aplicáveis.
Os alertas personalizados e a visualização de dados permitem que você identifique e evite rapidamente problemas de saúde e desempenho da rede.
Um SLA pode incluir uma descrição do serviço, objetivos do serviço, termos do contrato e cláusulas de rescisão, além de metas de desempenho e métricas de nível de serviço. Para garantir um meio de prestação de contas, um SLA define responsabilidades e funções tanto para o cliente quanto para o provedor. Crucial para a criação de um SLA aplicável são os procedimentos para gerenciamento de problemas, resolução de disputas e violações de segurança. Um SLA só será eficaz se houver processos para monitorar, monitorar, medir e relatar as métricas.
As três principais áreas de medição de métricas de SLA são o desempenho do sistema, o desempenho da resposta e a satisfação do cliente. As duas primeiras medições afetam a satisfação do usuário final.
Os SLAs bem-sucedidos são aqueles que atingem as métricas de desempenho e resposta definidas e resultam no atendimento das expectativas dos usuários finais.
A priorização das métricas de SLA será diferente para diferentes tipos de serviços. Por exemplo, o tempo de atividade e a disponibilidade seriam mais importantes para um serviço de hospedagem na Web, enquanto os tempos de resposta e as taxas de resolução de chamadas seriam mais relevantes para uma central de atendimento.
As métricas de desempenho comuns incluem latência, perda de pacotes, taxa de transferência, largura de banda, taxa de erro de rede, taxa de resposta de rede, tempo de atividade, confiabilidade, taxa de resolução de problemas, métricas de custo (por exemplo, medidas pela utilização de recursos e despesas operacionais), taxas de sucesso de backup e recuperação, alertas de incidentes, número de violações de conformidade, tendências de uso de recursos, bugs de software, violações de segurança e o desempenho de componentes de infraestrutura.
Uma métrica importante a ser considerada pelas empresas é o feedback de satisfação do cliente, pois isso está alinhado com o objetivo de alto nível de um SLA: reter clientes antigos e envolver novos clientes. Alinhado a isso está a medição do número de "resoluções de autoatendimento", ou situações em que os clientes resolvem seus tíquetes de suporte usando ferramentas e informações fornecidas no site da empresa.
As penalidades são especificadas em um SLA para que, se o provedor de serviços não cumprir suas obrigações contratuais, o cliente possa ser compensado pela interrupção dos negócios e pela perda de produtividade. A compensação pode assumir a forma de penalidades financeiras ou créditos de serviço, como termos de licença estendidos ou suporte adicional ao cliente de um provedor. No entanto, os clientes também precisam pesar o custo da remediação legal em relação às perdas financeiras; por esse motivo, um SLA deve incluir processos para o gerenciamento de problemas contestados.
Para resolver problemas contestados, as métricas rastreadas e medidas por meio de uma ferramenta de relatório de SLA podem ser usadas como prova de uma falha de SLA.
Os números relativos ao custo das penalidades do SLA variam, mas são sempre altos.
Em 2011, a Virgin Blue (agora Virgin Australia) obrigou o fornecedor de sistemas de reservas Navitaire a pagar quase 15 milhões de dólares por danos quando seu acordo de SLA foi violado. As interrupções da Navitaire duraram 11 dias, afetando milhares de passageiros da Virgin Blue.
Originalmente, a razão para a criação de SLAs no setor de TI era estabelecer expectativas e responsabilidade para os provedores de serviços, especialmente ao terceirizar serviços. Hoje, a maioria das empresas tem SLAs para garantir que as expectativas dos clientes sejam atendidas, para se indenizarem das consequências de falhas no sistema e para impor a responsabilidade por níveis de serviço ruins. Os SLAs reduzem os mal-entendidos entre os provedores de serviços e os clientes e servem como parâmetro para medir e melhorar o desempenho dos serviços.
As pessoas têm grandes expectativas em relação às empresas digitais e exigem altos padrões, como tempo de atividade, velocidade, disponibilidade e facilidade de uso. As empresas incluem SLAs em seus contratos para definir as expectativas e responsabilidades para si mesmas e para seus provedores de serviços, de modo que possam fornecer altos níveis de serviço a seus clientes. Esses acordos padronizados são usados em muitos setores, inclusive marketing, comércio eletrônico e SEO.
O objetivo ao estabelecer uma métrica não é agitar um bastão, mas motivar um comportamento positivo por parte do provedor de serviços. Portanto, ao criar um SLA, é estabelecida uma linha de base com medidas definidas para níveis de desempenho razoáveis e atingíveis.
Os SLAs não são o mesmo que termos e condições (T&Cs). Os SLAs se concentram na prestação de serviços e nos padrões, enquanto os T&Cs se concentram nos termos de venda, licenciamento e uso.
Os SLAs respondem a perguntas como: Com que rapidez um problema será resolvido? Como os dados dos clientes são protegidos? Quando um sistema estará disponível?
Os SLAs foram originalmente usados principalmente por provedores de serviços de rede para melhorar o desempenho do sistema e atender às expectativas dos clientes no espaço digital.
As métricas que precisam ser medidas e analisadas no monitoramento de rede incluem tempos de resposta da rede, disponibilidade do sistema, tempos de resolução de problemas, satisfação do cliente e métricas relacionadas ao desempenho. As métricas relacionadas ao desempenho e à resposta incluem a utilização de recursos, as taxas de erro de código, o rendimento, os tempos de resposta dos aplicativos, a segurança dos dados e o tempo médio de resposta (MTTR).
Um dos principais focos do monitoramento de rede é a disponibilidade do sistema. A TI inclui diversos fatores, como o tempo que leva para recuperar um sistema, se os dados foram comprometidos em um ataque cibernético e se a empresa sofreu danos à reputação.
As notificações em tempo real significam uma solução de problemas mais rápida para que você possa agir antes que ocorram problemas mais sérios.
As métricas de SLA podem ser difíceis de medir, rastrear e relatar. Por exemplo, se uma empresa promete resolver um problema em uma hora, pode não ser levado em conta que o help desk não tem todas as informações necessárias para diagnosticar o problema, por exemplo, se o cliente que registrou o problema saiu de férias.
O monitoramento automatizado da rede pode ajudar, permitindo que os provedores de serviços e as equipes de TI resolvam os problemas antes que eles se tornem um problema para os clientes.
Os relatórios de SLA garantem que os provedores de serviços sejam responsáveis por fornecer um nível de serviço acordado. Os relatórios de SLA também protegem os prestadores de serviços contra possíveis desvios de escopo nas demandas de seus clientes e ajudam a resolver disputas contratuais.
Os relatórios de SLA ajudam os desenvolvedores a identificar violações de conformidade e erros de sistema. Eles ajudam os desenvolvedores a identificar os gargalos do sistema e as áreas que precisam ser melhoradas.
Os relatórios de SLA ajudam os departamentos financeiros, DevOps e Teams de gerenciamento a criar estratégias, planejar e tomar decisões com informações úteis sobre alocação de recursos, capacidade e potencial de expansão dos negócios.
As métricas de SLA e os indicadores-chave de desempenho (KPIs) não são a mesma coisa. Os SLAs definem obrigações contratuais, enquanto os KPIs rastreiam métricas de desempenho para melhoria contínua. Os SLAs podem ser usados para identificar áreas em que podem ser feitas melhorias no desempenho do sistema, mas esse não é seu foco principal.
A maioria das organizações que têm ou usam serviços tem SLAs. Embora eles normalmente existam com fornecedores externos, também é possível que uma organização use SLAs entre departamentos. Os SLAs são implementados sempre que um problema pode surgir, por menor que seja.
Eles são usados por vários tipos de provedores de serviços, incluindo provedores de serviços de rede, provedores de serviços em nuvem, provedores de serviços gerenciados (MSPs) e data centers. Empresas digitais, serviços de comércio eletrônico e empresas que oferecem aplicativos de monitoramento de segurança implementam SLAs.
Os SLAs não são acordos de tamanho único e devem ser negociados para atender às necessidades e aos requisitos de uma organização.
Os contratos entre empresas e prestadores de serviços geralmente têm um SLA associado para evitar interpretações errôneas deliberadas ou não intencionais.
Os SLAs são usados quando há necessidade de formalizar o relacionamento entre os provedores de serviços e seus clientes. Inicialmente usados em ambientes de TI, eles também são relevantes em setores como marketing, vendas e SEO, nos quais as empresas geralmente dependem de agências externas. Por exemplo, os mercados on-line empregam consultores de SEO para melhorar suas classificações nos mecanismos de busca.
Os SLAs abrangem duas áreas principais: serviço e gerenciamento. Os elementos de serviço podem incluir padrões aceitáveis de serviços, serviços excluídos e compensações de custo/serviço.
Os elementos de gerenciamento podem incluir um processo de resolução de disputas, uma cláusula de indenização que proteja o cliente de litígios com terceiros no caso de violações do nível de serviço e um método para atualizar o contrato. Os SLAs são um trabalho em andamento, em que as ofertas e os recursos do provedor e os requisitos comerciais podem mudar com frequência. Por exemplo, equipamentos mais confiáveis ou ferramentas de monitoramento de SLA mais confiáveis podem possibilitar melhores garantias de serviço. Para levar em consideração as mudanças estratégicas comerciais e técnicas, os SLAs devem ser revisados regularmente.
Os SLAs permitem que as empresas mantenham os padrões de serviço, identifiquem lacunas de serviço e adicionem novos requisitos de negócios à medida que a empresa aumenta a escala ou adiciona novos recursos aos seus sistemas.
Os SLAs garantem a conformidade com as normas relevantes do setor, estabelecem penalidades para o desempenho insatisfatório e podem oferecer incentivos para o desempenho excelente.
Uma matriz de desempenho pode ajudar a promover a fidelidade do cliente, atendendo às suas expectativas.
Os SLAs garantem a continuidade dos negócios, definindo os processos a serem seguidos em caso de desastre e descrevendo as práticas recomendadas.
Os SLAs responsabilizam os prestadores de serviços por seus compromissos. Por exemplo, um SLA pode especificar que um cliente pode reduzir a taxa do provedor em uma determinada porcentagem se o tempo de atividade de 99,99% não for alcançado, conforme evidenciado pelo SLI da empresa.
Um SLA pode ser usado como ponto de referência para resolver questões controversas entre as empresas e seus provedores de serviços, e entre as empresas e seus clientes.
O monitoramento dos SLAs ajuda os provedores de serviços a detectar problemas potenciais com antecedência, o que lhes permite tomar medidas corretivas proativas.
A melhor maneira de manter o controle do desempenho é implementar uma ferramenta de monitoramento de rede de ponta a ponta, como o PRTG da Paessler. Essa ferramenta permite que as organizações configurem e monitorem os serviços de negócios, abrangendo serviços de usuário, infraestrutura e aplicativos. Os serviços são baseados em sensores que monitoram os sensores associados a dispositivos ou componentes. Os SLOs são definidos para esses sensores, por exemplo, quais são as taxas de falha aceitáveis para um dispositivo e qual é a prioridade da confiabilidade de um dispositivo. Se um valor de SLO for atingido, o SLA associado pode ser considerado violado e uma ação corretiva pode ser tomada.
As ferramentas de monitoramento dão aos funcionários de diferentes funções visibilidade do desempenho do sistema por meio de interfaces de usuário fáceis de usar.
Fatores externos podem interromper um serviço e influenciar o desempenho do SLA e devem ser cobertos em um SLA. Esses fatores incluem ataques cibernéticos, condições climáticas (por exemplo, danos ao equipamento causados por inundações ou incêndios), comportamento incomum do usuário (por exemplo, grandes volumes durante competições ou vendas em uma plataforma de comércio eletrônico) e alterações nos regulamentos de conformidade.
Medir muitas métricas pode ser contraproducente e pode levar a muitas violações de SLA. Os SLAs devem abranger os processos principais e o excesso de métricas pode diluir o impacto de uma delas, confundindo o provedor sobre o que deve ser priorizado. O excesso de métricas pode desviar a atenção dos serviços de missão crítica para os de menor prioridade. Deve-se levar em consideração se o provedor de serviços pode ou não controlar o desempenho de uma métrica conforme especificado.
Quando há SLAs separados para processos entre fornecedores, pode ser difícil responsabilizar os fornecedores por partes que estão fora de seu escopo.
As alterações em um SLA podem afetar negativamente as equipes de suporte, impossibilitando-as de cumprir suas obrigações, a menos que tenham sido notificadas sobre as alterações a tempo e tenham sido devidamente treinadas.
Os SLAs padrão são bons para medir os processos e as métricas de TI, mas não medem a satisfação do usuário final.
A resposta pode ser uma combinação de SLAs e acordos de nível de experiência (XLAs) para levar em conta a qualidade da experiência do usuário final.
O PRTG é um software abrangente de monitoramento de rede e mantém o controle de toda a sua infraestrutura de TI.
O PRTG SLA Reporter da Paessler é uma ferramenta poderosa que lhe permite manter o controle de seus SLAs. TI permite que as organizações selecionem elementos da árvore de dispositivos do PRTG e definam quais objetos de monitoramento são usados para monitorar um SLA. Os objetos de monitoramento incluem itens como sensores, sondas e dispositivos.
Uma vez instalado e funcionando, o que pode ser feito em cinco etapas fáceis, o PRTG SLA Reporter gera relatórios de SLA automaticamente. Um dos principais recursos do PRTG SLA Reporter é que ele permite que as equipes de TI reclassifiquem retroativamente as interrupções como planejadas ou não planejadas e refinem seus SLAs à medida que os requisitos mudam.