Nos últimos anos, vimos o campo de estudo da Inteligência Artificial aparecer em diversos programas de TV, Rádio e Internet. Palavras como Big Data, Data Science, Machine Learning e Deep Learning são rapidamente incorporadas ao vocabulário do mundo dos negócios.
Tendo em mente que muitas empresas gostariam de aplicar essas tecnologias em seus negócios, selecionei 3 dicas para gestores e executivos começarem a aplicar Machine Learning em suas empresas e aumentar suas chances de sucesso.
Dica 1: Diferencie uma falsa expectativa de uma realidade.
Para que isso aconteça, geralmente são necessárias três habilidades críticas:
- Compreender profundamente o modelo de negócio da empresa e os produtos/serviços;
- Técnicas de análise de dados e algoritmos de reconhecimento de padrões;
- Conhecimento em Tecnologia da Informação.
Observe que esses itens são difíceis de encontrar em uma pessoa, pois são papéis diferentes, exigindo a cultura do trabalho em equipe. De nada adianta ter o melhor cientista de dados do mercado, se não houver uma forte sinergia da empresa para alinhar os gestores de negócios com o cientista e também fornecer um mínimo de infraestrutura técnica de TI para viabilizar o projeto, além da apetite para correr riscos.
Dica 2: Lixo entra, Lixo sai!
A qualidade da solução de Machine Learning está diretamente relacionada à qualidade dos dados. Como os resultados são baseados em um suposto aprendizado sobre eles, isso só pode acontecer quando uma solução (modelo, algoritmo…) for capaz de generalizar fielmente a realidade de um negócio. A parte mais emocionante de trabalhar com Machine Learning é, sem dúvida, a parte de criar modelos, executar algoritmos e mostrar resultados, mas tudo depende da qualidade e relevância dos dados que serviram de entrada para essas tarefas. Ou seja, faça um bom trabalho de base.
Na verdade, a maior parte do tempo em um projeto de Machine Learning é gasto na organização, transformação e limpeza de dados. Alguns itens a serem cuidados:
- Os dados são realmente relevantes para resolver o problema da empresa?
Por exemplo, dados de receita em uma solução de recomendação de produto; - De onde e como os dados virão? Existe garantia de disponibilidade e atualização conforme a solução exige?
Exemplo: dados em tempo real, diários, semanais, mensais, recuperados automaticamente ou extraídos manualmente; - Os dados contêm muitos campos em branco ou nulos?
Aplicar uma transformação como média/mediana/moda dos valores ou deletar os registros com dados faltantes? - Os valores inseridos são confiáveis?
Exemplo: nos pontos de venda, os campos de ID do cliente são principalmente um número padrão, como 0000001. - Os dados estão no formato necessário para a solução e estão atualizados?
Exemplo: temos a idade de uma pessoa, mas refere-se ao momento em que se registou na loja.
Não importa se os dados são estruturados como planilhas do Excel ou tabelas de banco de dados, ou se não são estruturados como imagens, vídeos e áudio; ou se são obtidos, automaticamente, da internet ou extraídos manualmente. O importante é que sejam relevantes para a solução do problema do negócio (geralmente aumentando a receita ou reduzindo as despesas) e que sejam limpos e transformados de forma otimizada para o problema, pois se entrar lixo, certamente sairá lixo, também. Não há reciclagem.
Dica 3: Aprenda a lidar com as incertezas desse tipo de projeto
Quando trabalhamos com projetos de desenvolvimento de software, estamos acostumados a um tipo de realidade. Existem funcionalidades, na forma de requisitos a serem desenvolvidos, cronograma, custo e escopo bem definidos, na maioria das vezes. No caso de problemas, ajustes como aumentar o quadro de funcionários, aumentar o orçamento, adquirir melhores recursos, horas extras e priorizar o escopo podem efetivamente resolver o problema.
No caso de projetos de Machine Learning, pode haver algumas surpresas muito desagradáveis, já que a forma de conceber e gerenciá-los é um pouco diferente da forma usual. Um desses diferenciais é a forma de lidar com a incerteza do projeto.
Ao iniciar um projeto de Machine Learning, não é possível prometer um resultado perfeitamente preciso, da mesma forma que costumamos fazer em projetos de desenvolvimento de software. Imagine um projeto de reconhecimento de animais silvestres por meio de imagens tiradas de uma câmera de fazenda. Quando um animal se aproxima da câmera, uma foto é criada e o software de Machine Learning classifica o animal como galinha, gado ou lobo, por exemplo. Dependendo do tipo de animal detectado pelo software, uma ação diferente deve ser tomada, como contar galinhas ou soar um alarme ao detectar um lobo. Uma pergunta inicial poderia ser: qual o percentual de acertos na classificação dos animais?
Será 40%, 75% ou 90%? Quantas imagens são necessárias para ter uma boa precisão? Cem? Quinhentos? Mil? Dez mil? Duzentos de cada animal? Quando surgem novos tipos de animais, como incluí-los? Qual o impacto dessa inclusão nos novos resultados? Haverá muitos animais identificados incorretamente? Qual é o impacto de detectar incorretamente um lobo?
Antes de iniciar o projeto de aprendizado de máquina, devemos sempre definir claramente os indicadores de sucesso, como atingir 80% de precisão e tolerar apenas 10% de erro ou algo assim. No entanto, não é possível afirmar com certeza que um certo padrão de sucesso será alcançado. Em projetos muito inovadores, só podemos estimar os resultados. E em alguns casos, se a equipe técnica não for experiente e não deixar claros os riscos, dependendo dos resultados, podem ser geradas frustrações nos gerentes de projetos e patrocinadores. Na inovação, o risco e a incerteza são os fatores que definem este tipo de projeto.
Sem riscos? Sem inovação! Caso contrário, não é inovação, é apenas realizar a rotina. A boa notícia é que se um projeto de Machine Learning não atingir um nível de precisão esperado, existem várias técnicas para otimizar os resultados. Como exemplo :alterar os algoritmos, ajustes nos parâmetros e hiperparâmetros, tentar reduzir o viés e a variância.
Por isso, é sempre importante contar com profissionais experientes, ou começar com projetos simples e adquirir know-how ao longo do tempo. Mas, às vezes, a única solução realmente eficaz é ter uma quantidade de dados muito maior do que planejamos até agora. Por isso, é importante aprender a lidar com as incertezas do planejamento desse projeto e comunicá-las com transparência a todas as partes interessadas. Ou correremos o risco de ouvir um diálogo semelhante a este: – qual é o problema de não obter a precisão necessária? Precisamos resolver! Você pode comprar cerca de 5 servidores a mais que a empresa pagará! Ou pior: isso aconteceu porque não compramos os serviços de computação cognitiva Deep Learning “Ultra Power Mega Enhanced” da renomada empresa XYZ Corporation.
Social Contact