Sumber dimuat naik... memuat...

Istilah yang biasa digunakan untuk pembelajaran mesin dan perlombongan data

Penulis:Pencipta Kuantiti - Impian Kecil, Dicipta: 2017-03-20 09:58:22, Dikemas kini:

Istilah yang biasa digunakan untuk pembelajaran mesin dan perlombongan data

  • Sampling (Contoh):

    • Pengambilan sampel rawak mudah
    • Pengambilan sampel secara luar talian (K mungkin di luar talian, dll.)
    • Pengambilan sampel dalam talian (K mungkin sampel dalam talian dan sebagainya)
    • Ratio-based Sampling (Sampling secara rawak berdasarkan nisbah)
    • Pengambilan sampel penerimaan-penolakan
    • Importance Sampling (Contoh Kepentingan)
    • MCMC ((MarkovChain Monte Carlo MarkovMont Carlo: Metropolis-Hasting & Gibbs)
  • Clustering (Kelaborasi):

    • K bermaksud,
    • K-Mediods,
    • Dua mata K-means,
    • FK-bererti,
    • Canopy,
    • Spektral-KMeans (Kumpulan Spektral)
    • GMM-EM ((Menggabungkan model Gaussian - algoritma maksimum yang diharapkan diselesaikan))
    • K-Pototypes, CLARANS (berdasarkan pembahagian)
    • BIRCH (berdasarkan peringkat)
    • CURE (berdasarkan peringkat)
    • DBSCAN (berdasarkan ketumpatan)
    • CLIQUE ((berdasarkan ketumpatan dan berasaskan grid) ).
  • Classification & Regression (Klasifikasi & Regresi):

    • LR (Linear Regression)
    • LR (Logistic Regression Logical Regression)
    • SR (Softmax Regression mungkin regresi logik kelas)
    • GLM (Generalized Linear Model) ialah model linear yang digunakan untuk merangkumi semua model linear.
    • RR ((Ridge Regression Regression/L2 Regular Minimum 2x Regression),
    • LASSO ((Least Absolute Shrinkage and Selectionator Operator L1 adalah kaedah regresi dua kali minimum))
    • RF (Random Forest)
    • DT (Pohon Keputusan)
    • GBDT (Gradient Boosting Decision Tree) ialah sebuah pokok keputusan yang mempunyai gradien yang menurun.
    • CART (ClassificationAnd Regression Tree) ialah pokok regresi klasifikasi.
    • KNN (K-Nearest Neighbor)
    • SVM ((Support VectorMachine),
    • KF ((KernelFunction Fungsi Kernel PolynomialKernel Function Fungsi Kernel berbilang,
    • Guassian KernelFunction Fungsi Kernel Gaussian/Radial BasisFunction Fungsi RBF
    • String KernelFunction ()
    • NB (Naive Bayes, Bayesian Network/Bayesian Belief Network/Belief Network), BN (Bayesian Network/Bayesian Belief Network/Belief Network)
    • LDA (Linear Discriminant Analysis/FisherLinear Discriminant Analysis/Fisher Linear Discriminant Analysis) ialah kaedah analisis yang digunakan oleh ahli-ahli sains untuk mengenal pasti perbezaan antara jenis bahan yang digunakan dan jenis bahan yang digunakan.
    • EL (Ensemble Learning Integration Learning Boosting, Bagging, Stacking) adalah sebuah platform pembelajaran yang mempunyai pelbagai jenis pembelajaran.
    • AdaBoost (Adaptive Boosting) adalah sebuah aplikasi yang digunakan untuk meningkatkan kebolehan penyesuaian.
    • MEM (Model Entropi Maksimum)
  • Penilaian Keberkesanan:

    • Di sini, anda boleh melihat gambar yang menunjukkan bahawa anda telah berjaya.
    • Perincian yang lebih tinggi ialah:
    • Akurasi (kesesuaian), F-score (Skor F),
    • ROC Curve (kurva ROC), AUC (area AUC),
    • Lift Curve, KS Curve.
  • PGM (Probabilistic Graphical Models Probability Graph Model):

    • BN (Bayesian Network/Bayesian Belief Network/BeliefNetwork)
    • MC (Markov Chain)
    • HMM (Hidden Markov Model)
    • MEMM (Maximum Entropy Markov Model) ialah model yang digunakan untuk menentukan entropi maksimum.
    • CRF (Conditional Random Field) ialah lapangan terbang rawak bersyarat.
    • MRF ((Markov Random Field Markov Random Airport) ).
  • NN (Syarikat saraf):

    • ANN (Artificial Neural Network) adalah sebuah rangkaian saraf buatan yang dicipta oleh seorang pakar dalam bidang sains dan teknologi.
    • BP (Error BackPropagation) adalah satu kaedah yang digunakan untuk menyebarkan kesalahan ke arah belakang.
  • DeepLearning

    • Auto-encoder (pengekod automatik)
    • SAE (Stacked Auto-encoders) adalah satu set pengekod automatik yang ditumpuk.
    • Sparse Auto-encoders adalah pengekod automatik yang jarang berlaku.
    • Denoising Auto-encoders untuk menghalang pengekod automatik daripada membuat bunyi bising.
    • Contractive Auto-encoders (pengekod automatik kontraktif)
    • RBM (Restricted Boltzmann Machine) ialah mesin yang digunakan untuk menghidupkan dan mematikan mesin RBM.
    • DBN (Deep Belief Network) adalah rangkaian kepercayaan mendalam yang mengkaji tentang agama Islam.
    • CNN (Convolutional Neural Network) melaporkan bahawa seorang lelaki berusia 20 tahun, yang merupakan seorang ahli media, telah membunuh seorang wanita berusia 20 tahun.
    • Word2Vec (Model Pembelajaran Vektor Kata) ⇒
  • DimensionalityReduction (pengurangan dimensi):

    • LDA Linear Discriminant Analysis/Fisher Linear Discriminant
    • PCA (Principal Component Analysis) ialah analisis komponen utama.
    • ICA (Independent Component Analysis) ialah analisis komponen bebas yang dilakukan oleh sebuah syarikat yang berpangkalan di Singapura.
    • SVD (Singular Value Decomposition) ialah satu-satunya bentuk penguraian nilai tunggal.
    • FA (Faktor Analisis)
  • Text Mining (Pembijakan Teks):

    • VSM (Vector Space Model)
    • Word2Vec (Model Pembelajaran Vektor Kata)
    • TF (Term Frequency)
    • TF-IDF (Term Frequency-Inverse Document Frequency) ialah frekuensi terbalik dokumen yang digunakan untuk mencatatkan frekuensi terbalik.
    • MI (MutualInformation) saling berhubung,
    • ECE (Expected Cross Entropy) ialah entropy yang dijangkakan.
    • QEMI (Bandar Maklumat Kedua)
    • IG (InformationGain) - maklumat yang bertambah,
    • IGR (Information Gain Ratio) ialah kadar keuntungan maklumat.
    • Gini (penganjur Gini)
    • x2 Statistic ((x2 jumlah statistik),
    • TEW (TextEvidence Weight) adalah sebuah kumpulan media sosial yang mengkaji dan mengkaji maklumat yang terdapat dalam teks.
    • OR (Rasio Kebarangkalian)
    • Model N-Gram,
    • LSA (Latent Semantic Analysis) ialah analisis semantik latent.
    • PLSA (Probabilistic Latent Semantic Analysis, analisis semantik latent berdasarkan kebarangkalian)
    • LDA (Laten Dirichlet Allocation, Model Dirichlet Potensial)
  • Association Mining (dalam bahasa Inggeris: Association Mining):

    • Sebelum ini,
    • FP-growth (Frequency Pattern Tree Growth) ialah algoritma pertumbuhan pokok berpattern frekuensi yang digunakan untuk menjana pertumbuhan pokok.
    • AprioriAll,
    • Spade.
  • Enjin Cadangan:

    • DBR (Demographic-based Recommendation) adalah sebuah perlembagaan yang mengkaji dan mengkaji data yang berkaitan dengan populasi.
    • CBR (Context-basedRecommendation) - Rekomendasi berasaskan kandungan
    • CF (Collaborative Filtering ialah penapisan bersama)
    • UCF (User-based Collaborative Filtering Recommendation) adalah sebuah kumpulan penapis kolaboratif berasaskan pengguna.
    • ICF (Item-based Collaborative Filtering Recommendation) (Syarat penapisan kolaboratif berdasarkan projek)
  • Pengukuran Kesamaan & Pengukuran Jarak:

    • Jarak Euclidean
    • ManhattanDistance (Jarak Manhattan)
    • Jarak Chebyshev (Jarak Chebyshev)
    • Minkowski Distance (dalam bahasa Inggeris: Minkowski Distance)
    • Jarak Euclidean Standard (Jarak Euclidean Standard)
    • MahalanobisDistance (Jarak Mars)
    • Kos (Cosine Consonant)
    • HammingDistance/Edit Distance
    • JaccardDistance (Jarak Jaccard)
    • Jarak Gabungan (Correlation Coefficient)
    • Di sini, anda boleh melihat beberapa gambar yang menarik.
    • KL ((Kullback-Leibler Divergence KL dispersi/Relative Entropy relatif ketara) ).
  • Feature Selection (Algoritma Pilihan Ciri):

    • Mutual Information (Mutual Information) adalah sebuah laman web yang ditubuhkan di Malaysia.
    • DocumentFrequence (Frequency Dokumen)
    • Di sini, anda boleh melihat beberapa gambar yang menarik.
    • Ujian Chi-squared
    • Gini (penganjur Gini)
  • Outlier Detection (Algoritma Pengesanan Titik Kebiasaannya):

    • Statistik-based (berdasarkan statistik)
    • Di sini, anda boleh melihat beberapa gambar yang berbeza.
    • Density-based (berdasarkan ketumpatan)
    • Clustering-based (Berdasarkan kumpulan).
  • Learning to Rank (Pengaturcaraan berdasarkan pembelajaran):

    • Secara spesifik: McRank;
    • Di peringkat pasangan: RankingSVM,RankNet,Frank,RankBoost;
    • Dalam senarai: AdaRank,SoftRank,LamdaMART,..

Lebih lanjut