머신러닝에 대해 알아야 할 10가지 진실

저자:발명가들의 수량화 - 작은 꿈, 2017-09-20 09:14:41, 업데이트:

머신러닝에 대해 알아야 할 10가지 진실

기계 학습에 대한 설명은 종종 비전공자에게 설명하는 사람으로서, 저는 기계 학습에 대한 몇 가지 설명으로 다음과 같은 10 가지 사항을 정리했습니다.

  • #### 1, 기계 학습은 데이터로부터 배우는 것을 의미합니다.

머신러닝은 천연두에 대한 홍보와 같지 않습니다: 적절한 학습 알고리즘에 적절한 훈련 데이터를 제공함으로써 수많은 문제를 해결할 수 있습니다. 그것을 AI라고 부릅니다. 그것이 당신의 AI 시스템을 판매하는 데 도움이되는 경우. 그러나 알다시피, AI는 단지 사람들이 그것에 대해 기대하는 것을 나타내는 유행 단어입니다.

  • #### 2, 기계 학습은 주로 데이터와 알고리즘에 관한 것이지만 가장 중요한 것은 데이터입니다.

기계 학습 알고리즘, 특히 심층 학습의 발전은 많은 흥미로운 부분들을 가지고 있다. 그러나 데이터는 기계 학습을 가능하게 하는 중요한 요소이다. 기계 학습은 복잡한 알고리즘 없이도 가능하지만 좋은 데이터 없이도 불가능하다.

  • ###############################################################################################################################################################################################################################################################

기계 학습은 데이터의 패턴에 따라 모델을 훈련시키고, 매개 변수로 정의된 가능한 모델의 공간을 탐구한다. 매개 변수 공간이 너무 커지면 훈련 데이터에 너무 적합해지고, 자신을 일반화 할 수 없는 모델을 훈련한다. 이것을 자세히 설명하려면 더 많은 수학 계산이 필요하며, 당신은 이것을 기준으로 삼아야하며, 당신의 모델을 가능한 한 단순하게 만들어야 한다.

  • #### 4, 기계 학습의 품질은 훈련에 사용되는 데이터의 품질과 밀접하게 관련이 있습니다.

컴퓨터에 쓰레기를 입력하면 쓰레기 데이터의 덩어리가 나올 것이라는 말이 있습니다. 이 말은 기계 학습보다 먼저 등장했지만, 이것이 바로 기계 학습의 핵심 한계입니다. 기계 학습은 훈련 데이터에 존재하는 패턴만을 발견할 수 있습니다. 기계 학습 작업을 감독하기 위해 (예: 분류) 당신은 튼튼하고 올바르게 표시된 풍부한 훈련 데이터 세트가 필요합니다.

  • #### 5, 기계 학습은 훈련 데이터가 대표적 인 경우에만 작동합니다.

oi 펀드 출자 설명서에서 경고하는 바와 같이, 과거의 성능은 미래의 결과를 보장하지 않습니다. 기계 학습은 훈련 데이터와 동일한 분포를 기반으로만 작동할 수 있다는 것과 유사한 경고 진술을 보내야합니다. 따라서 훈련 데이터와 생산 데이터 사이의 오차에 주의하고 훈련 모델을 정기적으로 반복하여 그것이 시대에 뒤떨어지지 않도록 보장해야합니다.

  • #### 6, 기계 학습의 대부분은 데이터 변환에 관한 것입니다.

기계 학습 기술의 혼란스러운 홍보로 인해 기계 학습이 주로 알고리즘을 선택하고 조정하는 것이라고 생각할 수도 있습니다. 그러나 현실은 무모합니다: 대부분의 시간과 에너지는 데이터 정화 및 특징 엔지니어링에 소비됩니다. 즉, 원시적인 특징을 더 잘 나타낼 수있는 특징으로 변환합니다.

  • #### 7, 딥러닝은 혁명적인 발전이지만, 마법의 약물이 아닙니다.

머신러닝은 많은 분야에 적용되고 발전하고 있기 때문에, 딥러닝은 천연두로도 홍보되고 있다. 또한, 딥러닝은 전통적으로 특징 엔지니어링을 통해 수행되는 작업의 일부를 자동화하도록 촉진하고 있다. 특히 이미지 및 비디오 데이터에 대해. 그러나 딥러닝은 마법의 약물이 아니다. 준비된 것이 없으므로 사용할 수 있으며, 당신은 여전히 데이터를 청소하고 변환하는 데 많은 노력을 기울여야 한다.

  • #### 8, 기계 학습 시스템은 운영자 오류에 쉽게 영향을 받는다.

NRA에 사과하자면, 기계 학습 알고리즘은 살인자가 아니라 살인자입니다. 기계 학습 시스템이 고장 났을 때, 기계 학습 알고리즘에 문제가 있기 때문에 발생하는 경우가 거의 없습니다. 더 많은 경우, 인공 오류가 훈련 데이터에 도입되어 오차 또는 다른 시스템 오류가 발생합니다. 우리는 항상 회의적인 태도를 취하고 소프트웨어 엔지니어링에 적용되는 방법을 사용하여 기계 학습을 다루어야합니다.

  • #### 9, 기계 학습은 의도치 않게 자기 성취 예언을 만들 수 있습니다.

기계 학습의 많은 응용분야에서, 오늘 당신이 하는 결정은 내일 수집되는 훈련 데이터에 영향을 미칩니다. 기계 학습 시스템이 오차를 모델에 통합하면 오차가 강화된 새로운 훈련 데이터를 계속 생성할 수 있습니다. 또한, 일부 오차는 사람들의 삶을 파괴할 수 있습니다. 책임감을 가져가십시오: 자기 실현 예측을 만들지 마십시오.

  • ##### 10 AI는 스스로 깨어나지 않고 반란을 일으키지 않고 인간성을 파괴하지 않습니다.

꽤 많은 사람들이 과학 소설에서 인공지능에 대한 개념을 얻은 것 같습니다. 우리는 과학 소설에서 영감을 얻어야하지만 소설을 현실로 오해하는 게 너무 어리석습니다. 의식적인 악성 인간에서 무의식적인 편향된 기계 학습 모델에 이르기까지 걱정할 현실과 위험이 너무 많습니다. 그래서 SkyNet과 superintelligence를 걱정할 필요가 없습니다.

기계 학습에 관한 내용은 제가 앞서 언급한 10가지 설명보다 훨씬 더 많습니다. 이 소개 내용은 비전문가들에게 유용할 것으로 기대합니다.

세계 인공지능 빅데이터 플랫폼에서


더 많은 내용