Nos últimos anos, temos visto a área de Inteligência Artificial estar em diversos noticiários pela TV, Rádio e Internet. Palavras como Big Data, Ciência dos Dados (Data Science), Aprendizado de Máquina (Machine Learning) e Aprendizado Profundo (Deep Learning) são incorporadas ao vocabulário do mundo dos negócios rapidamente.

Tendo em vista que muitas empresas gostariam de aplicar essas tecnologias em seus negócios, eu selecionei 3 dicas para que gestores e executivos, público alvo deste texto, possam começar a pensar em como aplicar Machine Learning em suas empresas e ter maiores chances de sucesso.

Dica 1: Diferencie uma falsa expectativa de uma realidade.

Algumas pessoas insistem em afirmar que soluções de Machine Learning são como uma bala de prata: você tem os dados e basta a parte técnica colocar a mão neles, e num passe de mágica, a empresa terá rapidamente, por exemplo, respostas precisas sobre novos produtos, insights sobre comportamentos dos clientes e diversas soluções de negócios de forma automática, devido a algum algoritmo (conjunto de instruções) milagroso.

Outras, fazem propaganda de algum tipo de produto ou serviço que já está no mercado faz algum tempo, mas foi rebatizado como uma solução que agora possui Inteligência Artificial, pois devido a alta demanda sobre o tema e a falta de informações mais precisas, faz com que produtos antigos vendam mais, apenas pela nova roupagem. Por exemplo, um software que para chegar a algum resultado, internamente calculava algumas médias aritméticas, mas agora faz uso de uma regressão linear.

A verdade é que para se aplicar Machine Learning com sucesso é necessário não só ter conhecimento técnico sobre como extrair padrões úteis dos dados, mas principalmente como formular um bom problema de negócio a ser resolvido, além de criar uma cultura na empresa de se manter um ciclo completo de cuidado com os dados, que vai desde a correta seleção e coleta, até a disponibilização dos resultados com o foco no valor real para a estratégia da empresa, a ser mensurado geralmente, pela satisfação de seus gestores e dos clientes.

Para que isto ocorra, geralmente, são necessárias  3 habilidades críticas:

  1. conhecer profundamente o modelo de negócio e produtos / serviços da empresa;
  2. técnicas de análise de dados e algoritmos de reconhecimento de padrões;
  3. conhecimento em Tecnologia da Informação.

Notem que são itens dificilmente encontráveis em uma só pessoa, pois são papeis diferentes, necessitando da cultura de um trabalho em equipe. Pouco adianta ter o melhor cientista de dados do mercado, se não há uma forte sinergia da empresa para alinhar os gestores de negócio com o cientista e também prover um mínimo de infraestrutura técnica em TI para viabilizar o projeto, além do apetite para correr riscos.

Dica 2: Entra Lixo,  Sai Lixo!

A qualidade da solução de Machine Learning está diretamente relacionada com a qualidade dos dados.

Como os resultados se baseiam em um suposto aprendizado sobre eles, isto só poderá ocorrer quando uma solução (modelo, algoritmo…) conseguir generalizar com fidelidade a realidade de um negócio. A parte mais excitante em trabalhar com Machine Learning é, sem dúvida, a parte de criar modelos, executar algoritmos, e mostrar resultados, mas tudo depende da qualidade e relevância dos dados que serviram de entrada para essas tarefas. Ou seja, fazer um bom trabalho de base.

De fato, a maior parte do tempo em um projeto de Machine Learning é gasta com a organização, transformação e limpeza dos dados. Alguns itens que devem ser cuidados:

  1. Os dados são realmente relevantes para solucionar o problema da empresa?
    • Por exemplo, dados sobre renda em  uma solução de recomendação de produtos;
  2. De onde e como virão os dados? Há garantia de disponibilidade e atualização na medida que a solução requer?
    • Exemplo: dados em tempo real, diária, semanal, mensal, buscados automaticamente ou extraídos de forma manual;
  3. Os dados contém muitos campos em branco ou nulo?
    • Aplicar a média dos valores, moda, excluir os registros com dados faltantes?
  4. Os  valores inseridos são confiáveis?
    • Exemplo: nos pontos de vendas, os campos de CPF estarem em maioria 999.999.999-99.
  5. Os dados estão no formato requerido para solução e estão atualizados?
    • Exemplo: temos a idade de uma pessoa, mas refere-se a época em que ela se cadastrou na loja.

Não importa se os dados são estruturados como planilhas Excel ou tabelas de banco de dados, ou se são desestruturados como imagens, vídeos e áudio; ou se são obtidos, de forma automatizada, na internet ou extraídos de forma manual. O que  é importante é que sejam relevantes para a solução do problema de negócio (geralmente aumentar receita ou reduzir despesa) e que estejam limpos e transformados de forma otimizada para o problema, pois se entrar lixo, em forma de dados, certamente sairá lixo, também. Não há reciclagem.

Dica 3: Aprenda a lidar com as incertezas desse tipo de projeto

Quando trabalhamos com projetos de desenvolvimento de software, estamos acostumados com um tipo de realidade. Existem funcionalidades, em forma de requisitos a se desenvolver, um cronograma, custo e escopo bem definidos, na maioria das vezes. No caso de problemas, ajustes como aumento da equipe de colaboradores, incremento do orçamento, compra de melhores recursos, horas extras e priorização do escopo podem resolver de forma efetiva o problema.

No caso de  projetos de Machine Learning, podem ocorrer algumas surpresas bem desagradáveis, tendo em vista que a forma de conceber e gerenciá-los é um pouco diferente da forma habitual. Um destes diferenciais é a forma de se lidar com a incerteza nos projetos. Quando se inicia um projeto de Machine Learning, não é possível prometer um resultado perfeitamente exato, da mesma forma que tendemos a fazer em projetos de desenvolvimento de software.

Imagine um projeto de reconhecimento de animais selvagens por imagens obtidas de uma câmera de uma fazenda. Quando um animal se aproxima da câmera, uma foto é criada e o software de Machine Learning classifica o animal como galinha, boi ou lobo, por exemplo. Dependendo do tipo de animal que é detectado pelo software, uma ação diferente deve ser tomada, como realizar a contagem de galinhas ou soar um alarme ao detectar um lobo. Uma dúvida inicial poderia ser: qual o percentual de acerto na classificação dos animais?

Será 40%, 75% ou 90%? Quantas imagens são necessárias para se ter uma boa precisão? Cem? Quinhentas? Mil? Dez mil? Qual a distribuição? Duzentas de cada animal? Quando surgirem novos tipo de animais, como incluir? Qual o impacto dessa inclusão nos novos resultados? Haverão muitos animais identificados incorretamente? Qual o impacto de se detectar incorretamente um lobo?

Antes de iniciar o Projeto de Machine Learning,  sempre devemos definir claramente os indicadores de sucesso, como por exemplo, alcançar 80% de precisão, e só tolerar 10% de erro ou algo assim. Mas, não é possível afirmar com certeza, que se atingirá determinado padrão de sucesso. Apenas, podemos, através da experiência, estimar os resultados. E em alguns casos, se a equipe técnica não for experiente e não deixar claro os riscos, dependendo dos resultados, podem ser geradas frustrações em gestores e patrocinadores do projeto. Em inovação, o risco e a incerteza são os fatores que definem este tipo de projeto.

Não há inovação. sem riscos. Senão, não é inovação, é apenas a execução de um trabalho de rotina. A boa notícia, é que caso um projeto de Machine Learning não atinja um nível de precisão esperado, existem várias técnicas para se otimizar os resultados: como mudar os algoritmos,  ajustes em parâmetros e hiperparâmetros, tentar reduzir o viés (bias) e a variância. Por isso, é sempre importante contar com profissionais experientes, ou iniciar com projetos simples e ir adquirindo know-how ao longo do tempo.

Mas, em algumas vezes, a única solução realmente efetiva, é termos uma quantidade bem maior de dados do que planejávamos ter até o momento. Por isso, é importante aprender a lidar com as incertezas deste o planejamento do projeto e comunicá-las com transparência para todas as partes interessadas. Ou correremos o risco de ouvir um diálogo parecido com este: – qual o problema de não estarmos conseguindo a precisão necessária? Precisamos resolver! Podem comprar mais uns 5 servidores que a empresa irá bancar! Ou pior: Isso aconteceu porque não contratamos os serviços de computação cognitiva de Deep Learning Ultra Power Mega Enhanced da renomada empresa XYZ Corporation.

Sucesso a todos!