Takimi słowami rozpoczęła się moja prezentacja w konkursie IT Manager of Tomorrow Awards 2020. Reaktywne czy proaktywne praktyki do zarządzania incydentami i problemami? Które podejście jest lepsze? Sami się przekonajcie.
Firma Ensono zbudowana została z 3 mniejszych organizacji legacy rozproszonych po całym świecie, z oddzielnymi procesami Incident i Problem Management. Każda z firm miała inny system ITSM, inny workflow i inne podejście do zarządzania zgłoszeniami swoich klientów. Wyobrażacie sobie jaki to może wytworzyć bałagan w aspekcie zarządzania zgłoszeniami?
Jak w każdej organizacji wspierającej klientów z całego świata, dziennie otrzymujemy określone zgłoszenia do rozwiązania. Wszystkie zgłoszenia przechwytywane są przez nasz Service Desk i odpowiednio eskalowane do wyższych linii wsparcia. Wszystko byłoby dobrze, gdyby tych zdarzeń było kilka. Co jednak w momencie, gdy mamy ich średnio 40 tysięcy miesięcznie i ciężko w nich odnaleźć określoną strukturę? Efekt był natychmiastowy. Wzrastająca liczba Major Incydentów, a co za tym idzie działanie reaktywne powodujące pracę w ciągłym stresie. Typowy „Fire Fighting”. Pracownicy, którzy wymieniają się na różnych zmianach często rozwiązujący podobne zgłoszenia bez wymieniania się wiedzą i informacjami. Bardzo często przez natłok incydentów niedotrzymywaliśmy zdefiniowanych SLA z naszymi klientami. Wszystko to prowadziło do narastającej frustracji po stronie klientów i specjalistów IT. Tak było kiedyś. A co, gdyby sytuacje usprawnić, wypracować strukturę i poszukać zysków?
Reaktywne i proaktywne zarządzanie problemami
Naszym kołem ratunkowym w tej sytuacji okazało się początkowo samo podzielenie procesu Problem na Reactive i Proactive Problem Management. Zamiast skupiać się tylko na reaktywnym podejściu do problemów, zaczęliśmy analizować wpadające zdarzenia i szukać przyczyny wzrastającej liczby Incydentów. Wykorzystując dostępne w organizacji narzędzia szukaliśmy trendów i powtarzalności zdarzeń. Po pierwszych sukcesach pokazujących spadającą liczbę określonych powtarzalności, dostaliśmy zielone światło na zbudowanie nowego zespołu zajmującego się tylko Proaktywnym zarządzaniem Problemami.
Zamiast skupiać się tylko na reaktywnym podejściu do problemów, zaczęliśmy analizować wpadające zdarzenia i szukać przyczyny wzrastającej liczby Incydentów. Wykorzystując dostępne w organizacji narzędzia szukaliśmy trendów i powtarzalności zdarzeń. Po pierwszych sukcesach pokazujących spadającą liczbę określonych powtarzalności, dostaliśmy zielone światło na zbudowanie nowego zespołu zajmującego się tylko Proaktywnym zarządzaniem Problemami.
Bazując na zamkniętych zdarzeniach, w małym rozproszonym zespołem ludzi, segregowaliśmy monitory po ich opisach, klientach i częstotliwości wystąpienia. Doszukiwaliśmy się połączeń określonego zdarzenia z zaplanowanymi działaniami lub ze zmianami w infrastrukturze, które mogły wpłynąć na awarię lub reakcję systemów monitorujących. Szukając największej ilości określonych powtórzeń zbudowaliśmy listę priorytetów poprzez korelację Incydentów do problemów. Wybierając na początek zdarzenia te najbardziej kosztowne dla klientów i naszej firmy, zapoczątkowaliśmy współpracę z ekspertami wyższych linii wsparcia celem ich permanentnego rozwiązania. Do dziś prowadzimy spotkania z liderami zespołów i opracowujemy plan działania dla poszczególnych problemów.
Zebraliśmy oczekiwania klientów, ich opiekunów i naszych pracowników. Na podstawie tych informacji opracowaliśmy oddzielny proces z jasnym celem, planem działania i zakresem obowiązków. Przygotowaliśmy szkolenia i spotkania typu roadshow, aby dać możliwość zadawania pytań i wyjaśnienia wątpliwości i obaw. Aby trzymać proces w ryzach i kontrolować w którą stronę idziemy, wypracowaliśmy metryki i metody mierzenia. Obserwowaliśmy ilość otwieranych i zamykanych problemów oraz ilość powiązanych z nimi Incydentów. Wyliczaliśmy czas spędzony na powtarzających się incydentach. Co najważniejsze od samego początku byliśmy twarzą projektu i pierwszą linią kontaktu. Przez pewien czas pracowaliśmy z Service Deskiem i 1 Linią wsparcia celem wyszkolenia ich z analizowania incydentów i wyłapywania powtarzalności . Takie podejście mamy do dziś. Nowo zatrudnieni pracownicy otrzymują pakiet wewnętrznych szkoleń z zakresu procesów i podejścia proaktywnego.
Zbudowaliśmy obszerną bazę problemów z powiązanymi incydentami
Na efekty nie trzeba było długo czekać. Po niecałym roku wykorzystując dostępne narzędzia jak ServiceNow, Excel czy wewnętrzny system eventowy AIM zbudowaliśmy dashboardy pokazujące spadającą liczbę Incydentów na określone już rozwiązane zgłoszenia. Zbudowaliśmy obszerną bazę problemów z powiązanymi Incydentami, CI-jami i określonymi tematami. Opracowaliśmy Known Error Database opartą na problemach, których z różnych przyczyn nie jesteśmy w stanie na dzień dzisiejszy rozwiązać. Na podstawie już zamkniętych Problemów jesteśmy w stanie wyliczyć czas spędzony na incydentach i oszczędności jakie za tym idą. Rozwiązania problemów wykorzystujemy w systemie Zarządzania Wiedzą.
Prezentując takie dane managerom wyższego szczebla zyskaliśmy dużo większe zainteresowanie zamkniętymi już tematami. Wzrosło również zaangażowanie w podejście proaktywne i proponowanie usprawnień zanim wystąpi awaria. Dało nam to możliwość wypracowania współpracy z opiekunami naszych klientów. Poprzez cykliczne spotkania wyszukujemy potencjalne inicjatywy, poprzez które eliminujemy ryzyko major incydentów i zwiększamy możliwości usprawnień ich infrastruktury. U klientów, u których wprowadziliśmy takie podejście, zauważyliśmy dużo większą satysfakcję z serwisu który dostarczamy i rozwiązań które proponujemy.
Po połączeniu Problem Management z innymi procesami jak Incydent, Request i Change jesteśmy w stanie w łatwiejszy i bardziej przejrzysty sposób zarządzać nie tylko zdarzeniami, ale i oczekiwaniami naszych klientów. Poprzez zbieranie zdobytej wiedzy w systemie zarządzania wiedzą jesteśmy w stanie ułatwić pracę naszym współpracownikom. A to wszystko prowadzi do większej satysfakcji z pracy.
Po trzech latach pracy w zespole Problem Management, pracując z Reactive i Proactive Problem Management, nie mogę powiedzieć, że jedno czy drugie podejście jest złe czy dobre. Jednak z perspektywy czasu i świadomości skali naszej organizacji, jestem przekonana o wadze obu tych procesów, jeśli działają rozdzielnie i mamy do nich przypisane oddzielne zasoby. Reaktywne podejście do Problemów i doszukiwanie się przyczyny awarii oraz wynikające z tego akcje naprawcze są bardzo istotne. W końcu nie jesteśmy w stanie przewidzieć wszystkiego.
Lecz wykorzystując proaktywne praktyki do wykorzystania, analizowania danych i łączenia ze sobą faktów może ograniczyć nam ryzyko występowania awarii. Po połączeniu Problem Management z innymi procesami jak Incydent, Request i Change jesteśmy w stanie w łatwiejszy i bardziej przejrzysty sposób zarządzać nie tylko zdarzeniami, ale i oczekiwaniami naszych klientów. Poprzez zbieranie zdobytej wiedzy w systemie zarządzania wiedzą jesteśmy w stanie ułatwić pracę naszym współpracownikom. A to wszystko prowadzi do większej satysfakcji z pracy.
Agnieszka Kozłowska, Proactive Problem Manager, Ensono