A ideia de que o mundo está a ser transformado para um mundo melhor é uma ideia de que o mundo está a ser transformado para um mundo melhor.http://machinelearningmastery.com/practical-machine-learning-problems/Depois disso, podemos pensar sobre quais dados precisamos coletar e quais algoritmos podemos usar. Neste artigo, vamos passar por alguns dos algoritmos de aprendizado de máquina mais populares e entender quais são os mais úteis. Há muitos algoritmos no campo do aprendizado de máquina, e cada algoritmo tem muitas extensões, por isso é muito difícil determinar qual é o algoritmo certo para um problema específico. Neste artigo, eu quero dar-lhe duas maneiras de resumir os algoritmos que você encontrará na realidade.
Os algoritmos são divididos em diferentes categorias, dependendo de como eles processam a experiência, o ambiente ou qualquer coisa que chamamos de dados de entrada. Os livros de aprendizagem de máquina e inteligência artificial geralmente consideram primeiro o modo de aprendizagem que o algoritmo pode se adaptar.
Aqui são discutidos apenas alguns dos principais estilos de aprendizagem ou modelos de aprendizagem, e há alguns exemplos básicos. Essa classificação ou organização é boa, pois obriga você a pensar sobre o papel dos dados de entrada e o processo de preparação do modelo, e então escolher um algoritmo que melhor se adapte ao seu problema para obter os melhores resultados.
Supervisão de aprendizagem: os dados de entrada são chamados de dados de treinamento e têm resultados conhecidos ou marcados. Por exemplo, se um e-mail é spam, ou o preço de uma ação em um período de tempo. O modelo faz previsões e se estiver errado, é corrigido. O processo continua até que atinja um certo padrão certo para os dados de treinamento. Aprendizagem não-supervisionada: os dados de entrada não são marcados e não há resultados definidos. O modelo induz a estrutura e os valores numéricos dos dados. Exemplos de problemas incluem o aprendizado de regras de associação e problemas de agrupamento. Exemplos de algoritmos incluem o algoritmo Apriori e o algoritmo de média de K. Aprendizagem semi-supervisionada: os dados de entrada são uma mistura de dados marcados e não marcados, há alguns problemas de previsão, mas os modelos também precisam aprender a estrutura e a composição dos dados. Exemplos de problemas incluem problemas de classificação e regressão, e os exemplos de algoritmos são basicamente extensões de algoritmos de aprendizagem não supervisionados. Aprendizagem reforçada: os dados de entrada podem estimular o modelo e fazer com que ele responda. O feedback não só vem do processo de aprendizagem de supervisão, mas também da recompensa ou punição no ambiente. Exemplos problemáticos são o controle robótico, e exemplos de algoritmos incluem o Q-learning e o aprendizado de diferença temporal.
A maioria dos métodos de aprendizagem supervisionada e não-supervisionada são usados para integrar os dados em decisões de negócios. O próximo tópico é a aprendizagem semi-supervisionada, como problemas de classificação de imagens, onde há um grande banco de dados, mas apenas uma pequena parte das imagens é marcada.
Algoritmos são basicamente classificados por função ou forma. Por exemplo, algoritmos baseados em árvores, algoritmos de redes neurais. Esta é uma maneira útil de classificar, mas não é perfeita. Como muitos algoritmos podem ser facilmente divididos em duas categorias, como a quantização vetorial de aprendizagem, que é simultaneamente um algoritmo da classe de redes neurais e um método baseado em casos.
Nesta seção, eu listarei os algoritmos que eu acho que são os métodos mais intuitivos de classificação. Não tenho uma lista completa de algoritmos ou métodos de classificação, mas acho que é muito útil para dar aos leitores uma visão geral. Se você tem alguma coisa que eu não tenha listado, é bom deixar um comentário e compartilhar.
A regressão (regressão analítica) é preocupada com as relações entre as variáveis. Aplica-se a métodos estatísticos, e alguns exemplos de algoritmos incluem:
Quadrados mínimos ordinários Regressão logística Regressão gradual Splines de regressão adaptativa multivariada (MARS) Estimativa local de suavização do gráfico de dispersão (LOESS)
O aprendizado baseado em instâncias simula um problema de decisão, onde o exemplo ou exemplo usado é muito importante para o modelo. Essa abordagem consiste em criar um banco de dados com dados existentes e adicionar novos dados, e então usar um método de medição de similaridade para encontrar o melhor correspondente no banco de dados e fazer uma previsão. Por essa razão, esta abordagem também é conhecida como o método vencedor-o-rei e o método baseado em memória.
k-Vizinho mais próximo (kNN) Quantização de vetores de aprendizagem (LVQ) Mapa de autoorganização (SOM)
É uma extensão de outros métodos (geralmente métodos de regressão), que são mais favoráveis aos modelos mais simples e mais bons para a dedução.
Regressão de cordilheira Operador de redução e seleção mínima absoluta (LASSO) Rede elástica
Métodos de árvores de decisão (decision tree methods) são métodos que criam um modelo de decisão baseado em valores reais nos dados.
Árvore de classificação e regressão (CART) Dichotomisador iterativo 3 (ID3) C4,5 Detecção automática de interação (CHAID) Estúpido de decisão Floresta aleatória Splines de regressão adaptativa multivariada (MARS) Máquinas para aumentar o gradiente (GBM)
O método bayesiano é uma aplicação do teorema de Bayes para resolver problemas de classificação e regressão.
Bayes ingênuo Estimadores médios de dependência única (AODE) Rede de Crenças Bayesianas (BBN)
O mais famoso dos métodos do kernel é o de máquinas de vetores de suporte, que mapeia os dados de entrada em dimensões mais elevadas e facilita a modelagem de alguns problemas de classificação e regressão.
Máquinas vetoriais de suporte (SVM) Função de base radial (RBF) Análise linear discriminada (LDA)
Clustering, em si, descreve problemas e métodos. Métodos de agrupamento são geralmente classificados por meio de modelagem. Todos os métodos de agrupamento organizam os dados com uma estrutura de dados unificada, de modo que cada grupo tenha o maior número de pontos em comum.
K-Média Maximização das expectativas (EM)
O aprendizado de regras de associação é um método usado para extrair regras de dados que permitem descobrir ligações entre enormes quantidades de dados multidimensionais, e que podem ser usadas por organizações.
Algoritmo a priori Algoritmo Eclat
As redes neurais artificiais são inspiradas na estrutura e função das redes neurais biológicas. Pertence à categoria de correspondência de padrões e é frequentemente usada em problemas de regressão e classificação, mas existem centenas de algoritmos e composições variáveis.
Perceptron Propagação de volta Rede Hopfield Mapa de autoorganização (SOM) Quantização de vetores de aprendizagem (LVQ)
O método de aprendizagem profunda é uma atualização moderna de redes neurais artificiais. Em comparação com redes neurais tradicionais, ele tem uma estrutura de redes mais complexa, e muitos métodos estão preocupados com o aprendizado semi-supervisionado.
Máquina de Boltzmann restrita (RBM) Redes de Crenças Profundas (DBN) Rede de convolução Auto-codificadores empilhados
Dimensionality Reduction, como o método de agrupamento, busca e utiliza uma estrutura unificada nos dados, mas utiliza menos informações para fazer a abstração e descrição dos dados. Isso é útil para visualizar ou simplificar dados.
Análise dos componentes principais (PCA) Regressão parcial dos mínimos quadrados (PLS) Mapeamento de Sammon Escalagem multidimensional (MDS) Procurar a projeção
Os métodos de conjunto (ou métodos de combinação) são compostos por muitos modelos pequenos, que são treinados de forma independente e chegam a conclusões independentes, formando uma previsão geral. Muitos estudos se concentram em quais modelos são usados e como esses modelos são combinados.
Reforço Agregação bootstrapped (saco) AdaBoost Generalização em pilhas (mistura) Máquinas para aumentar o gradiente (GBM) Floresta aleatória
Este é um exemplo de adaptação com métodos combinados (de wiki), onde cada método de combate a incêndio é representado em cinza e a previsão final da síntese final é em vermelho.
Este passeio de algoritmos de aprendizagem de máquina pretende dar-lhe uma visão geral de quais algoritmos existem e algumas ferramentas de algoritmos associados.
Abaixo estão alguns outros recursos, por favor, não se preocupe, saber mais algoritmos é melhor para você, mas um conhecimento profundo de alguns algoritmos também pode ser útil.
Traduzido por: Bello Column / Big Flight Python