Como alguém que costuma explicar o aprendizado de máquina para os profissionais, eu organizei os seguintes dez pontos como algumas explicações sobre o aprendizado de máquina.
A aprendizagem de máquina não é como a propaganda da varíola: você pode resolver inúmeros problemas com dados de treinamento apropriados para o algoritmo de aprendizagem apropriado. Chame-lhe AI se isso ajudar a vender seu sistema de IA. Mas saiba que AI é apenas uma palavra de moda, que representa apenas as expectativas das pessoas sobre ele.
Há muitas coisas emocionantes em algoritmos de aprendizagem de máquina, especialmente em aprendizagem profunda. Mas os dados são o fator chave que torna possível o aprendizado de máquina.
A aprendizagem de máquina treina modelos com base em padrões nos dados, explorando o espaço de modelos possíveis definidos por parâmetros. Se o espaço de parâmetros for muito grande, o modelo será excessivamente adaptado aos dados de treinamento e treinado para um modelo que não pode se generalizar. Se você quiser explicar isso em detalhes, você precisará fazer mais cálculos matemáticos, e você deve usar isso como uma regra para tornar seu modelo o mais simples possível.
O ditado diz que, se você insere um monte de lixo no computador, o que sai também é um monte de dados lixo. Embora essa frase tenha surgido antes da aprendizagem de máquina, essa é exatamente a principal limitação da existência do aprendizado de máquina. O aprendizado de máquina só pode encontrar padrões existentes nos dados de treinamento.
oi Como adverte o prospecto do fundo, o desempenho passado não garante resultados futuros. O aprendizado de máquina também deve enviar uma declaração de aviso similar: ele só pode funcionar com base nos dados distribuídos da mesma forma que os dados de treinamento. Portanto, é necessário estar atento ao desvio entre os dados de treinamento e os dados de produção e repetir regularmente o modelo de treinamento para garantir que ele não seja obsoleto.
Sob a propaganda do desordem da tecnologia de aprendizagem de máquina, você pode pensar que a aprendizagem de máquina faz principalmente a seleção e ajuste de algoritmos. Mas a realidade é simples: a maior parte do seu tempo e energia será gasto em limpeza de dados e engenharia de características, ou seja, a conversão de características primitivas em características que melhor representam os sinais de dados.
Como a aprendizagem profunda tem sido aplicada e desenvolvida em muitos campos, a aprendizagem profunda também é propagada de forma desordenada. Além disso, a aprendizagem profunda impulsiona a automação de alguns trabalhos tradicionalmente realizados por engenharia de características, especialmente para dados de imagem e vídeo.
A NRA pede desculpas por não matar os algoritmos de aprendizagem de máquina, mas sim por matar os humanos. Quando um sistema de aprendizagem de máquina falha, raramente é porque há um problema com o algoritmo de aprendizagem de máquina. É mais provável que um erro artificial tenha sido introduzido nos dados de treinamento, resultando em desvios ou outros erros do sistema.
Em muitas aplicações de aprendizagem de máquina, as decisões que você toma hoje afetam os dados de treinamento que serão coletados amanhã. Uma vez que o sistema de aprendizagem de máquina integra os desvios no modelo, ele pode continuar a gerar novos dados de treinamento com desvios aumentados.
Uma quantidade considerável de pessoas parece ter obtido o conceito de inteligência artificial dos filmes de ficção científica. Devemos nos inspirar na ficção científica, mas não podemos ser tão estúpidos para confundir a ficção com a realidade. Desde humanos conscientes e malignos até modelos de aprendizagem de máquinas inconscientes e desviados, há muita realidade e perigos para se preocupar.
O que a aprendizagem de máquina envolve é muito mais do que as dez instruções que mencionei acima.
Traduzido de A.I. Global Big Data Plateau