segunda-feira, 5 de julho de 2021

Email Corporativo+Resposta Automática+30 mil empregados=Insanidade

Testemunhei esse colapso impressionante de TI por volta de 2004 em uma grande organização acadêmica.

Uma funcionária decidiu enviar uma ampla solicitação sobre sua necessidade de um apartamento local. Ela descobriu e usou um tipo de endereço de e-mail all-employees@org.edu que incluía todos. E por "todos", quero dizer todos os funcionários em uma instituição acadêmica de 30.000 funcionários. Todos, do CEO em diante, receberam o inquérito sobre o apartamento desta mulher.

Claro, isso deu início à rodada usual de respostas "por que estou recebendo isso" e "tire-me da lista" e "ai, todos parem de responder" ... cada resposta-todos para all-employees@org.edu, então 30.000 novas mensagens. O e-mail começou a ficar travado enquanto meio milhão de mensagens apareciam nas caixas de correio.

Falha de TI nº 1: Não necessariamente criando um endereço de e-mail all-employees@org.edu - isso é bastante razoável - mas concedendo acesso irrestrito a ele (em vez de configurar o servidor de e-mail para verificar o remetente e gerar um "não é o CEO = não autorizado ").

Esse não era o problema real. Esse incidente pode ter diminuído depois que as pessoas pararam de responder.

Em uma organização de 30 mil pessoas, muitas pessoas saem de férias e algumas delas (digamos, 20) se lembraram de definir seu e-mail para responder automaticamente sobre sua ausência. E os respondentes automáticos responderam aos mesmos destinatários - incluindo all-employees@org.edu. Portanto, cada mensagem "Não me importo com o seu apartamento" não gerou apenas 30.000 cópias de si mesma ... também gerou 30.000 * 20 = 600.000 novas mensagens. Até mesmo a avalanche de mensagens de apartamento foi abafada pelo volume de respostas automáticas do tipo "Estou fora até novembro".

Esse também não era o problema real, que, novamente, poderia ter morrido sozinho.

O problema REAL era que os servidores de e-mail eram bastante diligentes. Os respondentes automáticos não enviaram apenas uma mensagem "Estou ausente": eles enviaram uma mensagem "Estou ausente" em resposta a todas as mensagens recebidas ... incluindo as mensagens "Estou ausente" de outras secretárias-eletrônicas.

A avalanche de resposta automática converteu todo o sistema de correio em uma fábrica de replicação do tipo Agente-Smith de mensagens de ausência, à medida que os respondentes automáticos informavam incessantemente não apenas todos os funcionários, mas também uns aos outros, sobre a situação do funcionário.

Os sistemas de e-mail derreteram. Tudo ficou offline. De repente, uma empresa de 30 mil trabalhadores ficou sem e-mail por cerca de 24 horas.

Esse não é o fim da história.

A equipe de TI se ocupou em limpar as caixas de correio desses milhões de mensagens e desativar os respondentes automáticos. Eles colocaram o sistema de e-mail novamente online e sua primeira tarefa foi enviar um e-mail explicando a causa do problema, etc. E eles enviaram o e-mail de notificação para all-employees@org.edu.

Falha de TI nº 2: antes de enviarem sua mensagem de e-mail, eles desativaram a maioria dos respondentes automáticos - mas perderam pelo menos um.

Mais especificamente: eles perderam pelo menos dois.

Fonte:  Company-wide email + 30,000 employees + auto-responders = ...(r/talesfromtechsupport no Reddit).

Nenhum comentário:

Postar um comentário