O que é a aprendizagem de máquina?
As máquinas aprendem através da análise de grandes quantidades de dados. Por exemplo, não é necessário reconhecer gatos ou faces por meio de programação, elas podem ser treinadas usando imagens para identificar e identificar objetivos específicos.
A relação entre aprendizado de máquina e inteligência artificial
O aprendizado de máquina é uma disciplina de pesquisa e algoritmos que buscam padrões em dados e usam esses padrões para fazer previsões. O aprendizado de máquina é parte do campo da inteligência artificial e se interpõe com a descoberta de conhecimento e a mineração de dados.
Como funciona o aprendizado de máquina?
1 Seleção de dados: divida seus dados em três grupos: dados de treinamento, dados de verificação e dados de teste. 2 Dados do modelo: usar dados de treinamento para construir modelos usando características relevantes 3 Modelo de verificação: Use seus dados de verificação para acessar seu modelo 4 Modelo de teste: use seus dados de teste para verificar o desempenho do modelo verificado 5 Usar modelos: usar modelos totalmente treinados para fazer previsões sobre novos dados 6 Modelo de otimização: usar mais dados, características diferentes ou parâmetros ajustados para melhorar o desempenho do algoritmo
Onde está a aprendizagem de máquina?
1 Programação tradicional: o engenheiro de software escreve um programa para resolver um problema. Primeiro há alguns dados → Para resolver um problema, o engenheiro de software escreve um processo para dizer à máquina o que deve fazer→ O computador executa esse processo e obtém resultados 2 Estatística: analistas comparam as relações entre variáveis 3 Aprendizagem de máquina: o cientista de dados usa um conjunto de dados treinados para ensinar ao computador o que deve fazer e o sistema executa a tarefa. Primeiro, há big data → a máquina aprende a usar o conjunto de dados treinados para classificar, ajustar algoritmos específicos para alcançar a classificação de objetivos → o computador aprende a identificar relações, tendências e padrões nos dados. 4 Aplicações inteligentes: os resultados obtidos por aplicações inteligentes usando inteligência artificial, como mostrado na figura, são exemplos de aplicações de agricultura de precisão baseadas em dados coletados por drones.
Aplicações práticas de aprendizagem de máquina
Há muitos cenários de aplicação para a aprendizagem de máquina, e aqui estão alguns exemplos de como você pode usá-lo.
Mapeamento e modelagem rápidos em 3D: para construir uma ponte ferroviária, os cientistas de dados e especialistas em campo da PwC aplicam o aprendizado de máquina aos dados coletados pelos drones. Essa combinação permite monitoramento preciso e feedback rápido no sucesso do trabalho.
Análise aprimorada para reduzir o risco: Para detectar transações internas, o PwC combina o aprendizado de máquina com outras técnicas de análise para desenvolver um perfil de usuário mais abrangente e obter uma compreensão mais profunda de comportamentos complexos suspeitos.
Objetivo de melhor desempenho de previsão: PwC usa aprendizado de máquina e outros métodos de análise para avaliar o potencial de diferentes cavalos no Melbourne Cup.
Durante décadas, as "tribos" de pesquisadores de inteligência artificial têm competido entre si pela supremacia. É hora de unir as tribos? Eles podem ter que fazer isso, porque a cooperação e a fusão de algoritmos é a única maneira de alcançar uma inteligência artificial verdadeiramente universal (AGI).
Os cinco grandes gêneros
1 Simbolismo: uso de símbolos, regras e lógica para representar o conhecimento e fazer raciocínio lógico, com algoritmos favoritos: regras e árvores de decisão 2 Bayesian: obter probabilidades de ocorrência para fazer raciocínio de probabilidade, o algoritmo preferido é: simples Bayesian ou Markov 3 Conectivismo: uso de matrizes de probabilidade e neurônios ponderados para identificar e inferir padrões dinamicamente, o algoritmo preferido é: 4 Evolucionismo: gerar mudanças e então obter o melhor deles para um objetivo específico. 5 Analogizer: para otimizar funções de acordo com condições de restrição (ir o mais alto possível, mas ao mesmo tempo não sair do caminho), o algoritmo preferido é:
Fase de evolução
Anos 80
Gênero predominante: Simbolismo Arquitetura: servidor ou máquina grande Teoria dominante: engenharia do conhecimento Lógica de decisão básica: sistemas de apoio à decisão, utilidade limitada
Anos 90 a 2000
Gênero predominante: Bayes Arquitetura: Cluster de servidores pequenos A teoria dominante: a teoria da probabilidade Categoria: comparação ou contraste expansível, bom o suficiente para muitas tarefas
Início e meados dos anos 2010
Gênero predominante: Solidarismo Arquitetura: Large Server Farms Teoria dominante: Neurociência e probabilidade Reconhecimento: reconhecimento de imagem e voz mais preciso, tradução, análise de emoções, etc.
Os gêneros esperam trabalhar juntos e combinar suas respectivas abordagens
Fim da década de 2010
Gênero predominante: Uniformismo + Simbolismo Arquitetura: muitas nuvens Teorias dominantes: redes neurais de memória, integração em massa, raciocínio baseado no conhecimento A resposta é simples: compartilhamento de conhecimento específico de um campo, de um alcance restrito.
Anos 2020+
Os estilos dominantes são: Uniformismo + Simbolismo + Bayes +... Arquitetura: nuvem e neblina Teoria dominante: há redes para perceber, regras para raciocinar e trabalhar Percepção, raciocínio e ação simples: limitação de automação ou interação humano-robótica
2040s +
Gênero dominante: Fusão de algoritmos Arquitetura: Servidores em todas as partes A teoria dominante: a melhor combinação de meta-aprendizagem Percepção e resposta: agir ou responder com base no conhecimento ou experiência adquirida através de vários modos de aprendizagem
Qual algoritmo de aprendizagem de máquina você deve usar? Isso depende em grande parte da natureza e quantidade de dados disponíveis e dos objetivos de treinamento em cada caso específico. Não use os algoritmos mais complexos, a menos que o resultado valha a pena pagar custos e recursos caros. Aqui estão alguns dos algoritmos mais comuns, ordenados em função da facilidade de uso.
Árvore de decisão: durante o processo de resposta gradual, a análise de árvores de decisão típica usa variáveis de camada ou nós de decisão, por exemplo, para classificar um dado usuário como credenciável ou não credenciável.
Vantagens: É bom em avaliar uma série de diferentes características, qualidades e características de pessoas, lugares e coisas. Exemplos de cenários: Avaliação de crédito baseada em regras, previsão de resultados de corridas
Máquina de vetores de suporte: baseada em hiperplanos, com suporte a vectores que podem classificar conjuntos de dados.
Vantagens: Suporte para máquinas vetoriais que são excelentes em operações de classificação binária entre variáveis X e outras variáveis, independentemente de sua relação ser linear ou não Exemplos de cenários: classificação de notícias, reconhecimento de caligrafia.
Regressão: Regressão pode desenhar relações de estado entre uma variável causada e uma ou mais variáveis causadas. Neste exemplo, a distinção entre spam e não-spam é feita.
Vantagens: A regressão pode ser usada para identificar relações contínuas entre variáveis, mesmo que a relação não seja muito óbvia Exemplos de cenários: análise de tráfego de trânsito, filtragem de correio
Classificação Bayes naiva: O classificador Bayes naiva é usado para calcular a probabilidade de ramificação de condições possíveis. Cada característica independente é "não-prática" ou independente das condições, portanto, não afeta outros objetos. Por exemplo, qual é a probabilidade de duas esferas amarelas serem colhidas consecutivamente em um macaco com um total de 5 esferas amarelas e vermelhas?
Vantagens: Para objetos relevantes com características significativas em pequenos conjuntos de dados, o método Bayesian simples permite uma classificação rápida Exemplos de cenários: análise de emoções, classificação de consumidores
Modelo de Markov oculto: O processo de Markov oculto é o processo de certeza absoluta de que um estado dado é frequentemente acompanhado por outro; um sinal de trânsito é um exemplo; ao contrário, o modelo de Markov oculto calcula a ocorrência de estados ocultas por meio da análise de dados visíveis. Em seguida, com a análise de estados ocultas, o modelo de Markov oculto estimou possíveis padrões de observação futura. Neste caso, a probabilidade de pressão atmosférica alta ou baixa (este estado oculto) pode ser usada para prever a probabilidade de um dia limpo, chuvoso ou nublado.
Vantagens: Permite variabilidade de dados, para reconhecimento e operações de previsão Exemplos de cenários: análise de expressões faciais, previsão do tempo
Floresta aleatória: O algoritmo da floresta aleatória melhora a precisão das árvores de decisão usando várias árvores com subsetes de dados selecionados aleatoriamente. Este exemplo examina uma grande quantidade de genes associados ao retorno do câncer de mama no nível da expressão genética e calcula o risco de retorno.
Vantagens: o método da floresta aleatória provou ser útil para conjuntos de dados de grande escala e itens que possuem uma grande quantidade e, às vezes, características irrelevantes Exemplos de cenários: análise de perda de usuários, avaliação de riscos
Rede neural recorrente: em redes neurais arbitrárias, cada neurônio converte muitas entradas em uma única saída através de uma ou mais camadas ocultas. A rede neural recorrente (RNN) transmite os valores para além de camadas, permitindo a aprendizagem por camadas.
Vantagens: redes neurais circulatórias com capacidade de previsão quando há uma grande quantidade de informações organizadas Exemplos de cenários: categorização de imagens e adição de legendas, análise de sentimentos políticos
Memória de curto prazo (LSTM) e redes neurais de unidades recorrentes de controle de porta: Embora essas redes neurais de circuito iniciais permitissem manter apenas uma pequena quantidade de informações iniciais, as redes neurais de curto prazo (LSTM) e GRUs possuem memória de curto e longo prazo. Em outras palavras, essas redes RNNs possuem uma melhor capacidade de controle de memória, permitindo manter o processamento anterior ou reverter esses valores quando muitos passos da série são necessários, o que evita a degradação final dos valores que podem ser "reduzidos" ou transferidos por camadas.
Vantagens: a memória de curto e longo prazo e as redes neurais de células circulares de controle de portão possuem as mesmas vantagens que outras redes neurais circulares, mas são mais frequentemente usadas porque possuem melhor capacidade de memória Exemplos de cenário: processamento de linguagem natural, tradução
Rede neural convolutional: a convolução é a fusão de pesos provenientes de camadas subsequentes, que pode ser usada para marcar a camada de saída.
Vantagens: as redes neurais de convulsão são muito úteis quando há conjuntos de dados muito grandes, muitas características e tarefas de classificação complexas. Exemplos de cenários: reconhecimento de imagem, tradução de texto, detecção de drogas
http://usblogs.pwc.com/emerging-technology/a-look-at-machine-learning-infographic/
http://usblogs.pwc.com/emerging-technology/machine-learning-methods-infographic/
http://usblogs.pwc.com/emerging-technology/machine-learning-evolution-infographic/
Traduzido do Big Data Plateau