Sebagai orang yang sering menjelaskan pembelajaran mesin kepada orang-orang non-profesional, saya mengumpulkan sepuluh poin berikut sebagai beberapa penjelasan tentang pembelajaran mesin.
Pembelajaran mesin tidak seperti propaganda yang berantakan: dengan memberikan data pelatihan yang tepat kepada algoritma pembelajaran yang tepat, Anda dapat memecahkan banyak masalah. Sebut saja AI, jika itu membantu menjual sistem AI Anda. Tapi ketahuilah, AI hanyalah kata mode, yang hanya mewakili harapan orang tentangnya.
Ada banyak hal yang menarik tentang kemajuan algoritma pembelajaran mesin, terutama dalam pembelajaran mendalam. Tetapi data adalah faktor kunci yang memungkinkan pembelajaran mesin. Pembelajaran mesin dapat dilakukan tanpa algoritma yang rumit, tetapi tidak dapat dilakukan tanpa data yang baik.
Pembelajaran mesin melatih model berdasarkan pola dalam data, menjelajahi ruang model yang mungkin didefinisikan oleh parameter. Jika ruang parameter terlalu besar, itu akan terlalu cocok untuk data pelatihan, dan melatih model yang tidak dapat menggeneralisasikan diri. Jika Anda ingin menjelaskan hal ini secara rinci, maka perlu melakukan perhitungan matematika yang lebih banyak, dan Anda harus mengambil ini sebagai pedoman untuk membuat model Anda sesederhana mungkin.
Kata pepatah mengatakan bahwa jika Anda memasukkan sampah ke komputer, outputnya pasti akan menjadi sampah data. Meskipun ungkapan ini muncul lebih awal dari pembelajaran mesin, ini adalah batasan utama pembelajaran mesin. Pembelajaran mesin hanya dapat menemukan pola yang ada dalam data pelatihan. Untuk memantau tugas pembelajaran mesin (misalnya, klasifikasi), Anda memerlukan kumpulan data pelatihan yang kuat, ditandai dengan benar, dan kaya.
oi Seperti yang diperingatkan dalam buku panduan dana, kinerja masa lalu tidak menjamin hasil masa depan. Pembelajaran mesin juga harus memberikan pernyataan peringatan yang sama: itu hanya dapat bekerja berdasarkan data yang didistribusikan dengan data pelatihan yang sama. Oleh karena itu, perlu berhati-hati terhadap penyimpangan antara data pelatihan dan data produksi, dan sering mengulangi model pelatihan untuk memastikan bahwa itu tidak ketinggalan zaman.
Di bawah propaganda dari teknologi pembelajaran mesin yang kacau, Anda mungkin berpikir bahwa pembelajaran mesin hanya melakukan pilihan dan penyesuaian algoritma. Tetapi kenyataannya tidak mengherankan: sebagian besar waktu dan tenaga Anda akan dihabiskan untuk membersihkan data dan teknik karakteristik, yaitu mengubah karakteristik asli menjadi karakteristik yang lebih mewakili sinyal data.
Karena pembelajaran mesin telah diterapkan dan dikembangkan di banyak bidang, pembelajaran mendalam juga dipromosikan. Selain itu, pembelajaran mendalam mendorong beberapa pekerjaan yang secara tradisional dilakukan melalui rekayasa fitur untuk menjadi otomatis, terutama untuk data gambar dan video. Tetapi pembelajaran mendalam bukanlah obat gila. Tidak ada yang siap pakai yang dapat Anda gunakan, Anda masih perlu menghabiskan banyak tenaga untuk membersihkan dan mengubah data.
Maaf kepada NRA, algoritma pembelajaran mesin tidak membunuh, tetapi membunuh. Ketika sistem pembelajaran mesin gagal, itu jarang terjadi karena ada masalah dengan algoritma pembelajaran mesin. Lebih mungkin, kesalahan buatan dimasukkan ke dalam data pelatihan yang menghasilkan penyimpangan atau kesalahan sistem lainnya.
Dalam banyak aplikasi pembelajaran mesin, keputusan yang Anda buat hari ini akan mempengaruhi data pelatihan yang dikumpulkan besok. Begitu sistem pembelajaran mesin mengintegrasikan bias ke dalam model, itu dapat terus menghasilkan data pelatihan baru yang diperkuat oleh bias. Dan, beberapa bias dapat menghancurkan kehidupan orang.
Sejumlah besar orang tampaknya mendapatkan konsep tentang kecerdasan buatan dari film-film fiksi. Kita seharusnya mendapat inspirasi dari fiksi ilmiah, tetapi kita tidak bisa terlalu bodoh untuk menganggap fiksi sebagai realitas. Dari manusia yang sadar jahat hingga model pembelajaran mesin yang tidak sadar berbelit-belit, ada terlalu banyak realitas dan bahaya yang perlu dikhawatirkan. Jadi Anda tidak perlu khawatir tentang SkyNet dan superintelijen super.
Apa yang terlibat dalam pembelajaran mesin jauh lebih dari 10 poin yang saya sebutkan di atas. Saya berharap konten pengantar ini berguna bagi non-profesional.
Dikutip dari Global AI Big Data Platform