Un accordo sul livello del servizio (SLA) è un contratto legalmente vincolante tra un fornitore di servizi e i suoi clienti. IT documenta il livello di servizio atteso dal fornitore di servizi e delinea le aspettative e i requisiti del cliente. Uno SLA definisce le metriche in base alle quali viene misurata la qualità dei servizi, le penali che si possono incorrere nel caso in cui i livelli di servizio concordati non vengano raggiunti e le soluzioni a eventuali mancanze dello SLA.
Le penali per un'azienda derivanti da mancanze di SLA possono essere elevate. I tempi di inattività hanno un impatto significativo sui profitti dell'azienda, tra cui l'aumento dei costi di manodopera, la perdita di clienti, la perdita di entrate e la possibilità di pagare penali SLA, per cui si tratta di una metrica importante da monitorare e tenere sotto controllo. Un'indagine ITIC ha rilevato che il costo orario delle metriche SLA comunemente misurate, come i tempi di inattività, può superare i 300.000 dollari per il 91% delle PMI e delle grandi imprese.
Gli SLA sono una componente cruciale per qualsiasi azienda, ma soprattutto per le partnership tra clienti e fornitori di servizi in ambito tecnologico. Possono essere progettati per supportare entrambe le parti in queste partnership. Tuttavia, gli SLA standard forniti dai fornitori di servizi sono spesso generici, vengono applicati in generale a tutti i loro clienti e possono talvolta essere unilaterali. Pertanto, le aziende devono ricorrere a consulenti legali per garantire l'inclusione di interessi specifici del cliente in uno SLA, ad esempio le clausole di salvaguardia.
Esistono tre tipi principali di SLA: aziendali, del cliente e di servizio. Questi possono essere combinati per creare accordi a più livelli.
Uno SLA aziendale definisce il livello di servizio per specifici requisiti aziendali, come la sicurezza, in tutta l'organizzazione. Uno SLA basato sul cliente descrive i servizi di cui può usufruire un cliente specifico, ad esempio il reparto finanziario di un'organizzazione. Un contratto basato sui servizi riguarda un singolo servizio, ad esempio l'utilizzo di un'applicazione, fornito da un fornitore di servizi a un cliente o a un'azienda. La maggior parte delle organizzazioni utilizza più tipi di SLA per creare una struttura di SLA a più livelli o gerarchica.
I servizi possono essere forniti da fornitori esterni o internamente tra i reparti di un'organizzazione. Ad esempio, il reparto IT di un'organizzazione può redigere uno SLA tra sé e un altro reparto per la fornitura di hardware e servizi di assistenza.
Un obiettivo di servizio (SLO) è un accordo in uno SLA su una metrica specifica e quantificabile, come la disponibilità del sistema o il tempo di risposta. Un SLO definisce le metriche SLA, ad esempio che il tempo di attività deve essere del 99,99%.
Gli SLA sono utilizzati esternamente per definire un accordo tra le due parti. Gli SLA sono obiettivi che vengono misurati internamente per valutare se un benchmark SLA viene raggiunto. Gli SLO vengono monitorati misurando specifici indicatori del livello del servizio (SLI).
Uno SLI misura la conformità a uno SLO. Uno SLI è una misura interna che fornisce metriche effettive da confrontare con lo SLA. Ad esempio, se il livello di uptime è specificato come 99,99% e l'uptime effettivo, lo SLI, è 99,5%, significa che il livello di servizio concordato non è stato raggiunto.
A differenza degli SLA, gli SLO non comportano conseguenze contrattuali, ovvero penali che si verificano quando i parametri di riferimento specificati in uno SLA non vengono rispettati. Gli SLA sono legalmente applicabili.
Gli avvisi personalizzati e la visualizzazione dei dati consentono di identificare e prevenire rapidamente i problemi di salute e di prestazioni della rete.
Una SLA può includere una descrizione del servizio, gli obiettivi del servizio, i termini del contratto e le clausole di risoluzione, gli obiettivi di prestazione e le metriche del livello di servizio. Per garantire un sistema di responsabilità, uno SLA definisce le responsabilità e i ruoli del cliente e del fornitore. Per creare uno SLA applicabile sono fondamentali le procedure per la gestione dei problemi, la risoluzione delle controversie e le violazioni della sicurezza. Uno SLA è efficace solo se esistono processi per il monitoraggio, la misurazione e il rapporto sulle metriche.
Le tre aree principali di misurazione delle metriche SLA sono le prestazioni del sistema, le prestazioni dirisposta e la soddisfazione del cliente. Le prime due misure hanno un impatto sulla soddisfazione dell'utente finale.
Gli SLA di successo sono quelli che raggiungono le metriche di prestazione e di risposta definite e soddisfano le aspettative degli utenti finali.
La priorità delle metriche SLA sarà diversa per i vari tipi di servizi. Ad esempio, il tempo di attività e la disponibilità sono più importanti per un servizio di web hosting, mentre i tempi di risposta e i tassi di risoluzione delle chiamate sono più rilevanti per un call center.
Le metriche di performance più comuni includono la latenza, la perdita di pacchetti, il throughput, la larghezza di banda, il tasso di errore della rete, il tasso di risposta della rete, il tempo di attività, l'affidabilità, il tasso di risoluzione dei problemi, le metriche di costo (ad esempio, misurate in base all'utilizzo delle risorse e alle spese operative), i tassi di successo del backup e del ripristino, le segnalazioni di incidenti, il numero di violazioni della conformità, le tendenze di utilizzo delle risorse, i bug del software, le violazioni della sicurezza e le prestazioni dei componenti dell'infrastruttura.
Una metrica importante da considerare per le aziende è il feedback di soddisfazione dei clienti, in quanto è in linea con l'obiettivo di alto livello di una SLA: conservare i vecchi clienti e coinvolgerne di nuovi. In questo senso, è importante misurare il numero di "risoluzioni autonome", ovvero di situazioni in cui i clienti risolvono i loro ticket di assistenza utilizzando gli strumenti e le informazioni fornite sul sito web dell'azienda.
Le penali sono specificate in una SLA in modo che, se il fornitore del servizio non rispetta gli obblighi contrattuali, il cliente possa essere risarcito per l'interruzione dell'attività e la perdita di produttività. La compensazione può assumere la forma di penali finanziarie o di crediti di servizio, come l'estensione dei termini di licenza o l'assistenza aggiuntiva da parte del fornitore. Tuttavia, i clienti devono anche valutare il costo della riparazione legale rispetto alle perdite finanziarie; per questo motivo, una SLA dovrebbe includere processi per la gestione dei problemi contestati.
Per risolvere le questioni controverse, le metriche tracciate e misurate con uno strumento di rapporto SLA possono essere utilizzate come prova del fallimento di una SLA.
Le cifre relative al costo delle penali SLA variano, ma sono sempre elevate.
Nel 2011, Virgin Blue (ora Virgin Australia) ha imposto al fornitore di sistemi di prenotazione Navitaire il pagamento di quasi 15 milioni di dollari a titolo di risarcimento danni in seguito alla violazione dell'accordo SLA. Le interruzioni di Navitaire erano durate 11 giorni, colpendo migliaia di passeggeri di Virgin Blue.
In origine, la creazione di SLA nel settore IT aveva lo scopo di stabilire le aspettative e la responsabilità dei fornitori di servizi, in particolare in caso di outsourcing. Oggi, la maggior parte delle aziende dispone di SLA per garantire il rispetto delle aspettative dei clienti, per indennizzarsi dalle conseguenze di eventuali guasti del sistema e per imporre la responsabilità in caso di livelli di servizio insufficienti. Gli SLA riducono le incomprensioni tra fornitori di servizi e clienti e fungono da parametro per misurare e migliorare le prestazioni del servizio.
Le persone hanno grandi aspettative nei confronti delle aziende digitali e chiedono standard elevati, come tempo di attività, velocità, disponibilità e facilità d'uso. Le aziende includono gli SLA nei loro contratti per definire le aspettative e le responsabilità per loro stesse e per i loro fornitori di servizi, in modo da poter fornire alti livelli di servizio ai loro clienti. Questi accordi standardizzati sono utilizzati in molti settori, tra cui marketing, e-commerce e SEO.
L'obiettivo quando si stabilisce una metrica non è quello di agitare un bastone, ma di motivare un comportamento positivo da parte del fornitore del servizio. Pertanto, quando si crea una SLA, si stabilisce una linea di base con misure definite per livelli di prestazioni ragionevoli e raggiungibili.
Gli SLA non sono la stessa cosa dei termini e condizioni (T&C). Gli SLA si concentrano sulla fornitura di servizi e sugli standard, mentre i T&C si concentrano sulle condizioni di vendita, licenza e utilizzo.
Gli SLA rispondono a domande quali: Quanto velocemente verrà risolto un problema? Come vengono protetti i dati dei clienti? Quando sarà disponibile un sistema?
Gli SLA sono stati originariamente utilizzati soprattutto dai fornitori di servizi di rete per migliorare le prestazioni del sistema e soddisfare le aspettative dei clienti nello spazio digitale.
Le metriche che devono essere monitorate e analizzate nel monitoraggio della rete includono i tempi di risposta della rete, la disponibilità del sistema, i tempi di risoluzione dei problemi, la soddisfazione dei clienti e le metriche relative alle prestazioni. Le metriche relative alle prestazioni e alle risposte includono l'utilizzo delle risorse, i tassi di errore del codice, il throughput, i tempi di risposta delle applicazioni, la sicurezza dei dati e il tempo medio di risposta (MTTR).
Uno degli obiettivi principali del monitoraggio della rete è la disponibilità del sistema. IT include diversi fattori, come il tempo necessario per ripristinare un sistema, se i dati sono stati compromessi in un attacco informatico e se l'azienda ha subito danni alla reputazione.
Notifiche in tempo reale significano una risoluzione più rapida dei problemi, in modo da poter intervenire prima che si verifichino problemi più gravi.
Le metriche SLA possono essere difficili da misurare, tracciare e riportare. Ad esempio, se un'azienda promette di risolvere un problema entro un'ora, potrebbe non essere preso in considerazione il fatto che l'help desk non disponga di tutte le informazioni necessarie per diagnosticare il problema, ad esempio se il cliente che ha registrato il problema è andato in vacanza.
Il monitoraggio automatico della rete può essere d'aiuto, consentendo ai service provider e ai team IT di risolvere i problemi prima che diventino un problema per i clienti.
Il rapporto SLA garantisce che i fornitori di servizi siano responsabili della fornitura di un livello di servizio concordato. I rapporti SLA proteggono inoltre i fornitori di servizi da un potenziale aumento della portata delle richieste dei clienti e aiutano a risolvere le controversie contrattuali.
I rapporti SLA aiutano gli sviluppatori a identificare le violazioni della conformità e gli errori di sistema. Aiutano gli sviluppatori a individuare i colli di bottiglia del sistema e le aree da migliorare.
I rapporti SLA aiutano i reparti finanziari, DevOps e i Teams di gestione a strategizzare, pianificare e prendere decisioni con informazioni utili sull'allocazione delle risorse, sulla capacità e sul potenziale di scalabilità dell'azienda.
Le metriche SLA e gli indicatori chiave di prestazione (KPI) non sono la stessa cosa. Gli SLA definiscono gli obblighi contrattuali, mentre i KPI tengono traccia delle metriche di prestazione per il miglioramento continuo. Gli SLA possono essere utilizzati per identificare le aree in cui è possibile migliorare le prestazioni del sistema, ma non sono il loro obiettivo principale.
La maggior parte delle organizzazioni che hanno o utilizzano servizi hanno degli SLA. Sebbene questi esistano tipicamente con i fornitori esterni, è anche possibile che un'organizzazione utilizzi gli SLA tra i vari dipartimenti. Gli SLA vengono implementati ovunque possa sorgere un problema, per quanto piccolo.
Sono utilizzati da numerosi tipi di fornitori di servizi, tra cui fornitori di servizi di rete, fornitori di servizi cloud, fornitori di servizi gestiti (MSP) e data center. Le aziende digitali, i servizi di e-commerce e le aziende che offrono applicazioni per il monitoraggio della sicurezza implementano tutti gli SLA.
Gli SLA non sono accordi unici e devono essere negoziati per adattarsi alle esigenze e ai requisiti di un'organizzazione.
I contratti tra aziende e fornitori di servizi di solito prevedono una SLA associata, per evitare interpretazioni errate, intenzionali o meno.
Gli SLA vengono utilizzati quando è necessario formalizzare il rapporto tra i fornitori di servizi e i loro clienti. Inizialmente utilizzati negli ambienti IT, sono rilevanti anche in settori come il marketing, le vendite e la SEO, dove le aziende si affidano spesso ad agenzie esterne. Ad esempio, i mercati online si avvalgono di consulenti SEO per migliorare il posizionamento sui motori di ricerca.
Gli SLA coprono due aree principali: il servizio e la gestione. Gli elementi del servizio possono includere gli standard accettabili, i servizi esclusi e i compromessi costo/servizio.
Gli elementi di gestione possono includere un processo di risoluzione delle controversie, una clausola di indennizzo che protegge il cliente da controversie con terzi in caso di violazione dei livelli di servizio e un metodo per aggiornare l'accordo. Gli SLA sono un work in progress, in cui le offerte e le capacità dei fornitori e i requisiti aziendali possono spesso cambiare. Ad esempio, apparecchiature più affidabili o strumenti di monitoraggio degli SLA più affidabili potrebbero rendere possibili migliori garanzie di servizio. Per tenere conto dei cambiamenti tecnici e commerciali strategici, gli SLA devono essere rivisti regolarmente.
Gli SLA consentono alle aziende di mantenere gli standard di servizio, di identificare le lacune del servizio e di aggiungere nuovi requisiti di business quando un'azienda cresce o aggiunge nuove funzionalità ai propri sistemi.
Gli SLA assicurano la conformità alle normative di settore, stabiliscono penali per le prestazioni scadenti e possono offrire incentivi per le prestazioni eccellenti.
Una matrice di prestazioni può contribuire a promuovere la fedeltà dei clienti, soddisfacendone le aspettative.
Gli SLA assicurano la continuità operativa definendo i processi da seguire in caso di disastro e descrivendo le best practice.
Gli SLA rendono i fornitori di servizi responsabili dei loro impegni. Ad esempio, uno SLA può specificare che un cliente può ridurre la tariffa del fornitore di una determinata percentuale se non viene raggiunto un tempo di attività del 99,99%, come dimostrato dalla SLI dell'azienda.
Uno SLA può essere utilizzato come punto di riferimento per la risoluzione di questioni controverse tra le aziende e i loro fornitori di servizi e tra le aziende e i loro clienti.
Il monitoraggio degli SLA aiuta i fornitori di servizi a rilevare tempestivamente potenziali problemi, consentendo loro di adottare azioni correttive proattive.
Il modo migliore per monitorare le prestazioni è quello di implementare uno strumento di monitoraggio della rete end-to-end, come il PRTG di Paessler. Questo strumento consente alle organizzazioni di impostare e monitorare i servizi aziendali, che coprono i servizi per gli utenti, l'infrastruttura e le applicazioni. I servizi si basano su sensori che monitorano i sensori associati a dispositivi o componenti. Per questi sensori vengono definiti degli SLO, ad esempio quali sono i tassi di guasto accettabili per un dispositivo e quale priorità ha l'affidabilità di un dispositivo. Se viene raggiunto un valore SLO, la SLA associata può essere considerata violata e vengono intraprese azioni correttive.
Gli strumenti di monitoraggio offrono ai dipendenti con ruoli diversi la visibilità delle prestazioni del sistema attraverso interfacce grafiche di facile utilizzo.
I fattori esterni possono interrompere un servizio e influenzare le prestazioni dello SLA e dovrebbero essere contemplati in uno SLA. Questi fattori includono attacchi informatici, condizioni meteorologiche (ad esempio, danni alle apparecchiature causati da inondazioni o incendi), comportamenti insoliti degli utenti (ad esempio, volumi elevati durante le gare o le vendite su una piattaforma di e-commerce) e cambiamenti nelle normative di conformità.
Misurare troppe metriche può essere controproducente e può portare a troppe violazioni degli SLA. Gli SLA sono destinati a coprire i processi fondamentali e un numero eccessivo di metriche può diluire l'impatto di una di esse, confondendo il fornitore su quale sia la priorità da dare. Troppe metriche possono distogliere l'attenzione dai servizi mission-critical a quelli di priorità inferiore. È necessario considerare se il fornitore del servizio può controllare se una metrica funziona come specificato.
In presenza di SLA separati per processi trasversali, può essere difficile ritenere i fornitori responsabili per parti che esulano dal loro ambito di applicazione.
Le modifiche a uno SLA possono avere un impatto negativo sui team di supporto, rendendo impossibile l'adempimento dei loro obblighi, a meno che non siano stati informati per tempo delle modifiche e non siano stati adeguatamente formati.
Gli SLA standard sono buoni per misurare i processi e le metriche IT, ma non misurano la soddisfazione degli utenti finali.
La risposta potrebbe essere una combinazione di SLA e di accordi sul livello di esperienza (XLA) per tenere conto della qualità dell'esperienza dell'utente finale.
PRTG Network Monitor è un software di monitoraggio di rete completo e tiene traccia dell'intera infrastruttura IT.
PRTG SLA Reporter è un potente strumento che consente di tenere traccia degli SLA. IT consente alle organizzazioni di selezionare elementi dall'albero dei dispositivi del PRTG e di definire gli oggetti di monitoraggio utilizzati per monitorare una SLA. Gli oggetti di monitoraggio includono sensori, sonde e dispositivi.
Una volta installato e funzionante, operazione che può essere eseguita in cinque semplici passaggi, PRTG SLA Reporter genera automaticamente rapporti SLA. Una delle caratteristiche principali di PRTG SLA Reporter è che consente ai Teams di riclassificare retroattivamente le interruzioni come pianificate o non pianificate e di perfezionare i loro SLA in base ai cambiamenti dei requisiti.