機械学習について説明する10つのポイントをまとめました.
機械学習は天気予報のようなものではなく,適切な学習アルゴリズムに適切なトレーニングデータを与えることで,無数の問題を解決できます.AIと呼ぶならAIシステムを売るのに役立ちます.しかし,AIは単なる流行語であり,それに対する期待を表すだけです.
機械学習アルゴリズム,特に深層学習の進歩には多くのエキサイティングなところがあります. しかし,データこそが機械学習を可能にする重要な要素です. 機械学習は複雑なアルゴリズムなしにはできるが,良いデータなしにはできない.
機械学習はデータ内のパターンに基づいてモデルを訓練し,パラメータによって定義された可能なモデル空間を探索する.パラメータ空間が大きすぎると,トレーニングデータに過剰に適合し,自己一般化できないモデルを訓練する.詳細に説明するには,より多くの数学的な計算が必要であり,これを指針として使用し,あなたのモデルをできるだけシンプルにする必要があります.
コンピュータにゴミを大量に入力すると,ゴミのデータも大量に生成されると言われています.この言葉は機械学習よりも先に登場しましたが,これは機械学習の存在の重要な限界です.機械学習は訓練データの中に存在するパターンをのみ発見します.機械学習のタスクを監視するために (例えば分類) 堅牢で,正しく標識付けされ,豊富なトレーニングデータセットが必要です.
oi 募集中説明書で警告されているように,過去のパフォーマンスが将来の結果を保証するものではない.機械学習も同様の警告文を送るべきである:それは訓練データと同じ分布のデータに基づいてのみ動作する.したがって,訓練データと生産データとの間の偏差に注意を払い,訓練モデルを定期的に繰り返して,それが時代遅れでないことを保証する必要があります.
機械学習技術の
機械学習は多くの分野で応用・発展しているため,ディープラーニングも天気予報を浴びている.さらに,ディープラーニングは,伝統的に特徴工学によって行われていた作業が,特に画像・ビデオデータについて,自動化されるよう促している.しかし,ディープラーニングはオピカではない.即効のものがないので,あなたはまだデータを清掃し,変換するために多くのエネルギーを投入する必要があります.
NRAに謝罪します. 機械学習アルゴリズムは殺すものではなく,殺す人なのです. 機械学習システムが故障すると,機械学習アルゴリズムに問題があることが滅多にありません. より可能性が高いのは,人工的なエラーが訓練データに導入され,偏差や他のシステムエラーが生じるということです. 私たちは常に懐疑的な態度をとり,ソフトウェアエンジニアリングに適用される方法で機械学習を扱うべきです.
マシン・ラーニングの多くのアプリケーションでは,今日あなたがする決定が明日のトレーニングデータに影響します. マシン・ラーニングシステムが偏差をモデルに組み込むと,偏差が強化された新しいトレーニングデータを生成し続けることができます. そして,偏差の一部は人々の生活を台無しにする可能性があります. 責任を持ってください:自己実現の予言を作ってはいけません.
相当な数の人々が,Science Fiction 映画から人工知能の概念を得ているように見える.我々は,Science Fiction からインスピレーションを得るべきだが,小説を現実と間違えるほど愚かではない.意識的な邪悪な人間から無意識の偏った機械学習モデルまで,心配する必要のある現実と危険があまりにも多くある.だから,SkyNet と superintelligence と心配する必要はない.
機械学習には,私が述べた10点以上の説明以上の内容が含まれています. この説明は,非専門家に役立つことを願っています.
グローバル・AI・ビッグデータ・プレイスから