O Grupo Recovery, empresa do setor de recuperação de crédito que integra o Grupo Itaú, implementou mudanças em sua infraestrutura de Tecnologia com o objetivo de garantir a continuidade das operações críticas, que funcionam 24 horas por dia.
A rotina da companhia envolve cerca de 100 mil ligações e 25 mil acordos fechados por dia, em parceria com bancos e birôs de crédito conectados à sua plataforma em nuvem.
Grande parte desses processos ocorre fora do horário comercial, sobretudo durante a madrugada, o que torna indispensável a alta disponibilidade dos sistemas.
“São operações críticas, como as consolidações de dados de pagamento via sistemas de terceiros. Se um servidor parceiro fica fora do ar, o início da operação no dia seguinte fica comprometido”, explicou Wendel Santos, diretor de tecnologia (CTO) do Grupo Recovery.
Redução de incidentes e maior previsibilidade
Antes da adoção do novo modelo, a complexidade da operação resultava em alto número de incidentes técnicos, exigindo mobilização frequente das equipes de TI durante noites e fins de semana. Para reverter esse cenário, foi implantada uma solução de monitoramento e gestão de incidentes capaz de mapear processos sensíveis, identificar gargalos e aumentar a previsibilidade das falhas.
De acordo com a empresa, os primeiros resultados vieram rapidamente. Houve queda de 30% no volume de incidentes críticos, além de ganhos no tempo de diagnóstico e resposta. Em seis meses, os acionamentos fora do expediente diminuíram em 80%, passando de 110 em 2024 para 21 neste ano.
Proatividade no atendimento
Segundo Santos, a solução também elevou o nível de proatividade na operação. “Em um dos casos, identificamos e notificamos parceiros que estavam com o servidor fora do ar antes mesmo que percebessem o problema, o que evitou impacto direto nos acordos”, relatou.
Inteligência artificial no monitoramento
Entre os recursos utilizados está a implantação de um centro de comando de nova geração (NGCC, na sigla em inglês), que aplica inteligência artificial, aprendizado de máquina e análise de dados para identificar padrões, prever falhas e responder automaticamente a incidentes.