Blog

Como começar a usar AIOps

Escrito por em fevereiro de 23, 2021

Como começar a usar AIOps 1

"Houston, nós temos um problema."

Isso é exatamente o que as pessoas em Operações de TI pensam sempre que uma série de alertas de monitoramento disparam simultaneamente. Em cinco minutos, eles recebem o convite para a ligação e começam a ler o que cada monitor está relatando. A equipe analisa incidentes levantados no Cherwell, alertas de rede do Nagios, alertas do sistema no LogicMonitor, arquivos de log no Splunk e implantações do Jenkins para identificar as causas potenciais e decidir o curso de ação.

Como começar a usar AIOps 4

Quinze minutos após o início da chamada, os líderes de negócios se juntam para obter o status e lembrar a todos os níveis de serviço esperados em aplicativos essenciais aos negócios. Os líderes de negócios têm expectativas mais altas sobre a confiabilidade e o desempenho do sistema, especialmente em aplicativos voltados para o cliente e fluxos de trabalho críticos.

Pode ser estressante para as operações de TI gerenciar, e AIOps é uma solução que vem para ajudar a TI a melhorar a confiabilidade do sistema e a satisfação do cliente, reduzindo parte do trabalho manual.

O que é AIOps?

Líderes de TI proativos procure aplicar os recursos de AIOps para reduzir as complexidades, aprimorar as experiências dos funcionários e melhorar os níveis de serviço.

AIOps se refere à aplicação de recursos de IA e aprendizado de máquina para dar suporte às operações de TI. Um resultado obrigatório de AIOps ajuda a TI a correlacionar vários alertas de monitoramento em um único incidente sequenciado no tempo que é mais fácil de revisar e mais rápido de resolver. Isso pode mostrar que uma implantação de Integração Contínua (CI) / Entrega Contínua (CD) acionou falhas de banco de dados seguidas por erros de aplicativo e os agrupou em um único incidente. Um gerente de incidentes vendo essa sequência pode rapidamente deduzir a causa raiz, consultar a equipe de desenvolvimento sobre as mudanças recentes e determinar as etapas necessárias para restaurar o serviço.

AIOps em gerenciamento de incidentes e processamento de dados de várias ferramentas de monitoramento é um caso de uso de inteligência de plataforma. A aplicação de IA e aprendizado de máquina em operações de TI também inclui:

  • Mapeamento de Descoberta e Dependência (DDM) automatizações para capturar mudanças de infraestrutura de nuvem híbrida, manter o CMDB e capturar dependências entre sistemas.
  • Agentes virtuais use o Processamento de Linguagem Natural (NLP) para ajudar os usuários finais a pesquisar e acessar o catálogo de serviços.
  • Análise de sentimento aplicada ao feedback do usuário final pode desencadear um acompanhamento pelo service desk de TI quando houver uma resposta negativa do cliente.
  • A categorização de solicitações de aprendizado de máquina pode melhorar as solicitações de mapeamento para os serviços corretos e encaminhá-los para a equipe certa.

Com vários recursos de aprendizado de máquina disponíveis, os líderes de operações de TI devem considerar as etapas a seguir para começar a usar AIOps.

1. Configure as fontes de dados AIOps

Os algoritmos de aprendizado de máquina exigem fontes de dados limpas, portanto, as primeiras etapas para habilitar os recursos de AIOps são conectar as fontes de dados e iterar por meio de suas configurações.

As equipes de TI devem começar configurando DDM para capturar dados de sistemas, rede e aplicativos de data centers, nuvens privadas e nuvens públicas, incluindo AWS e Azure. O DDM deve atualizar o CMDB regularmente e as operações de TI devem mapear as informações dos sistemas para serviços de negócios e níveis de serviço.

Práticas de ITSM como gerenciamento de incidentes e gerenciamento de mudanças têm muito mais contexto com um CMDB com tecnologia DDM. Incidentes e tíquetes de mudança já capturam o que aconteceu e, com um CMDB integrado com tecnologia DDM, os tíquetes também podem incluir onde aconteceram. O contexto adicionado ajuda a TI a resolver problemas com mais rapidez e permite análises em áreas com problemas repetidos.

Como começar a usar AIOps 3

Em segundo lugar, conecte todas as ferramentas de monitoramento de sistema, rede e aplicativo a uma central Solução AIOps. Esta solução deve reduzir o ruído na revisão de várias ferramentas de monitoramento, correlacionando vários alertas a um incidente gerenciável. Conectar as fontes de dados também começa a capturar dados históricos para análise preditiva e detecção de anomalias, uma vez que haja dados suficientes para treinar algoritmos de aprendizado de máquina.

2. Descubra pontos de dor e oportunidades de ITSM

Depois que a TI conecta o DDM ao CMDB e agrega os dados de monitoramento, é hora de colocar os dados em uso e melhorar os KPIs. A TI deve buscar oportunidades para melhorar a satisfação do cliente, tempo médio para resolver problemas (MTTR) e confiabilidade do sistema.

As equipes de operação de TI proativas examinam essas melhorias estrategicamente seguindo as etapas abaixo:

  1. Classifique e priorize os pontos problemáticos operacionais de TI do gerenciamento de incidentes, gerenciamento de solicitações e serviços com impactos nos negócios.
  2. Revise os dados e percepções no DDM e ferramentas de monitoramento de percepções e execute um exercício de descoberta de dados. Identifique “o que os dados dizem a você” e quais oportunidades de melhoria os dados sugerem.
  3. Alinhe os pontos problemáticos com as oportunidades para ajudar a priorizar as áreas de foco.
  4. Determine as partes interessadas que podem orientar as melhorias de processo e articular critérios de sucesso.
  5. Identifique quais métricas ou KPIs demonstram se as melhorias atendem aos critérios de sucesso selecionados.

Essas etapas garantem que a TI ganhe um parceiro de negócios na implementação e invista esforços nas áreas que proporcionam o maior impacto nos negócios.

3. Use Agile Processed para implementar soluções

Esse processo de identificação de partes interessadas, prioridades e KPIs também ajuda a definir um processo contínuo de melhorias. À medida que as equipes usam insights baseados em dados para identificar oportunidades e estabelecer parcerias com as partes interessadas em pontos problemáticos, deve surgir um acúmulo de projetos de melhoria de processos.

O backlog é exatamente o que os líderes de TI proativos precisam ao implementar os recursos de AIOps. Esses líderes devem formar equipes ágeis em operações de TI para implementar melhorias iterativamente.

Por que um processo ágil? As prioridades tendem a mudar com base nas necessidades, oportunidades e riscos do negócio. A equipe pode se concentrar em aplicativos de computação de usuário final nos primeiros sprints para oferecer suporte a ambientes de trabalho híbridos. O grupo pode então mudar para trabalhar com uma equipe de desenvolvimento de aplicativos que está modernizando aplicativos e migrando-os para a nuvem.

Em ambos os cenários, mapas de topologia, visualizações de infraestrutura e outras ferramentas DDM ajudam a equipe a identificar oportunidades de implementação.

Como começar a usar AIOps 2

Por exemplo, digamos que os usuários finais abram tíquetes de incidente para um tempo de resposta lento do aplicativo durante a tarde. O relatório de topologia do DDM pode ajudar as operações de TI a identificar o gargalo, comparando os fluxos de aplicativos entre os períodos de desempenho fraco e normal. A equipe pode então escolher ajustar os parâmetros de elasticidade da nuvem para aumentar a infraestrutura nas áreas de gargalo antes dos períodos de pico. Após as modificações, a equipe monitora o desempenho e os incidentes para validar se a mudança abordou o problema.

Usando ano Solução AIOps, incluindo um subconjunto DDM de uma solução, permite este ciclo orientado por dados de melhoria de processos. O aprendizado de máquina em DDM e AIOps reduz a complexidade de trabalhar com várias fontes de dados ou dados obsoletos. Em vez disso, permite que a TI se concentre no cliente, entenda os pontos fracos, implemente soluções e valide os resultados. O resultado é uma equipe proativa de operações de TI que está constantemente melhorando e entregando um desempenho de sistema mais forte para as partes interessadas de negócios.

Abasteça a entrega de serviços ágil e automatizada para sua organização, agendando uma demonstração da solução AIOps da Cherwell.

Solicite uma demonstração

Isaac Sacolick, presidente da StarCIO, orienta as empresas por meio de programas de transformação digital mais inteligentes, rápidos, inovadores e seguros que fornecem resultados de negócios. Ele é o autor do best-seller da Amazon, Driving Digital: o guia do líder para a transformação de negócios por meio da tecnologia, indústria alto falantee blogger em Social, Agile e Transformação.

Você também pode estar interessado em

Blog
5 melhores práticas para DDM e CMDB para melhorar o gerenciamento de mudanças

O CMDB é uma fonte de dados ITSM crítica, pois define o contexto que conecta o gerenciamento de incidentes, o gerenciamento de solicitações e os processos de gerenciamento de mudanças a sistemas, aplicativos e serviços de negócios. Um recurso de detecção sem agente e mapeamento de dependência (DDM) integrado ao CMDB é a virada do jogo. Aprenda como.

Mais informações

Blog
Como melhorar o gerenciamento de incidentes com um CMDB movido a DDM

Os CMDBs são notoriamente imprecisos, mas com um recurso de detecção automática e mapeamento de dependência (DDM), o CMDB é uma ferramenta e fonte de informações críticas para as operações de TI. Aprenda como o DDM pode ajudar as operações de TI a reduzir o número de incidentes, resolvê-los com mais rapidez, encontrar as causas básicas e capturar métricas de nível de serviço para justificar a priorização de investimentos.

Mais informações

Turbine seu ITSM com mapeamento de detecção e dependência em um CMDB inteligente
Blog
Turbine seu ITSM com mapeamento de detecção e dependência em um CMDB inteligente

Os CMDBs têm uma importância cada vez maior hoje, além do gerenciamento de ativos e do gerenciamento de configuração. As organizações que conduzem a transformação digital, investem no desenvolvimento de aplicativos e habilitam arquiteturas de nuvem híbrida ou multi-nuvem usam seus CMDBs para melhorar o gerenciamento de incidentes e habilitar outros serviços de suporte de TI.

Mais informações

Saiba mais sobre nossas atualizações nos artigos de conhecimento da Cherwell