Como alguien que a menudo explica el aprendizaje automático a los no profesionales, he recopilado los siguientes diez puntos como algunas explicaciones sobre el aprendizaje automático.
El aprendizaje automático no es como la propaganda de la viruela: puedes resolver un sinnúmero de problemas con datos de entrenamiento adecuados en el algoritmo de aprendizaje adecuado. Llámenlo IA si eso ayuda a vender tu sistema de IA. Pero ten en cuenta que AI es solo una palabra de moda que solo representa lo que se espera de ella.
Los avances en algoritmos de aprendizaje automático, especialmente en el aprendizaje profundo, tienen muchos lugares emocionantes. Pero los datos son el factor clave que hace posible el aprendizaje automático. El aprendizaje automático puede ser sin algoritmos complejos, pero no puede ser sin buenos datos.
El aprendizaje automático entrena modelos basándose en patrones en los datos, explorando el espacio de posibles modelos definidos por parámetros. Si el espacio de parámetros es demasiado grande, se sobreajusta a los datos de entrenamiento y se entrena un modelo que no puede generalizarse a sí mismo.
El dicho dice que si ingresas una pila de basura a la computadora, la salida también será una pila de datos basura. Aunque esta frase surgió antes que el aprendizaje automático, esta es precisamente la limitación clave de la existencia del aprendizaje automático. El aprendizaje automático solo puede encontrar patrones existentes en los datos de entrenamiento.
oi Como advierte el prospecto del fondo, el desempeño pasado no garantiza los resultados futuros. El aprendizaje automático también debe emitir una advertencia similar: solo puede funcionar con datos distribuidos de la misma manera que los datos de entrenamiento. Por lo tanto, es necesario estar alerta al desvío entre los datos de entrenamiento y los datos de producción y repetir el modelo de entrenamiento con frecuencia para garantizar que no sea obsoleto.
Bajo la propaganda del desorden de la tecnología de aprendizaje automático, es posible que pienses que el aprendizaje automático se basa principalmente en la selección y ajuste de algoritmos. Pero la realidad es bastante simple: la mayor parte de tu tiempo y energía se gastará en la limpieza de datos y la ingeniería de características, es decir, la conversión de características primitivas a características que mejor representan las señales de datos.
Debido a que el aprendizaje profundo se ha aplicado y desarrollado en muchos campos, el aprendizaje profundo también está siendo promocionado como una varicela. Además, el aprendizaje profundo impulsa la automatización de algunos trabajos que tradicionalmente se realizan a través de la ingeniería de características, especialmente para datos de imágenes y videos. Pero el aprendizaje profundo no es un remedio.
Disculpe a la NRA, los algoritmos de aprendizaje automático no matan, son los asesinos. Cuando un sistema de aprendizaje automático falla, rara vez es porque hay un problema con el algoritmo de aprendizaje automático. Lo más probable es que se introduzca un error artificial en los datos de entrenamiento, lo que produce desviaciones u otros errores del sistema.
En muchas aplicaciones de aprendizaje automático, las decisiones que tomas hoy afectan a los datos de entrenamiento que se recopilarán mañana. Una vez que el sistema de aprendizaje automático integra los desviaciones en el modelo, puede continuar generando nuevos datos de entrenamiento con mayor desviación. Además, algunos desviaciones pueden arruinar la vida de las personas.
Un número considerable de personas parecen haber tomado el concepto de inteligencia artificial de las películas de ciencia ficción. Debemos inspirarnos en la ciencia ficción, pero no podemos ser tan tontos como para confundir la novela con la realidad. Desde humanos conscientes malvados hasta modelos de aprendizaje automático inconscientes con desviaciones, hay demasiada realidad y peligros para preocuparse.
El contenido de aprendizaje automático va mucho más allá de los 10 puntos que mencioné anteriormente.
Transcrito de la plataforma global de inteligencia artificial para el Big Data