Istilah berkaitan pembelajaran mesin dan perlombongan data biasa

Dicipta dalam: 2017-03-20 09:58:22, dikemas kini pada:
comments   0
hits   1744

Istilah berkaitan pembelajaran mesin dan perlombongan data biasa

  • Sampling:

    • Simple Random Sampling (Pemilikan rawak mudah)
    • OfflineSampling (Offline Sampling, mungkin K)
    • “Saya tidak tahu apa-apa tentang apa yang berlaku di Malaysia, tetapi saya tidak tahu apa yang berlaku di Malaysia.
    • Sampling berasaskan nisbah (Ratio-based Sampling)
    • Acceptance-RejectionSampling (Sampling Kebenaran-Penghapusan)
    • Importance Sampling (Sampling Kepentingan)
    • MCMC ((MarkovChain Monte Carlo: Metropolis-Hasting & Gibbs))
  • Clustering:

    • K-Means,
    • K-Mediods,
    • K-Means, dua pertiga.
    • FK-Means,
    • Canopy,
    • Spectral-KMeans (pengumpulan spektrum)
    • GMM-EM, model Gaussian campuran - algoritma yang dijangka akan menyelesaikan masalah ini.
    • K-Pototypes, CLARANS (berdasarkan pembahagian),
    • BIRCH (berdasarkan hierarki)
    • CURE (berdasarkan hierarki)
    • DBSCAN (berdasarkan ketumpatan)
    • CLIQUE ((berdasarkan ketumpatan dan berdasarkan grid)
  • Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression: Classification&Regression

    • LR (Linear Regression) ialah kaedah yang digunakan untuk mengkaji dan mengkaji keadaan.
    • LR (LogisticRegression) adalah kaedah logik yang digunakan untuk mengkaji semula keadaan.
    • SR (Softmax Regression)
    • GLM (Generalized Linear Model) ialah model linear yang meluas.
    • RR (Ridge Regression)
    • LASSO ((Least Absolute Shrinkage andSelectionator Operator L1 Regression kepada Bilangan Dua Paling Minimal)
    • RF (hutan rawak)
    • DT: Saya tidak tahu apa yang anda fikirkan.
    • GBDT (Gradient BoostingDecision Tree) adalah satu daripada dua buah pokok keputusan yang dicipta oleh Google.
    • CART (Classification And Regression Tree) adalah sebuah kumpulan kumpulan yang terdiri daripada dua jenis pokok.
    • KNN (K-Nearest Neighbor K)
    • SVM(Support VectorMachine),
    • KF ((KernelFunction Fungsi teras PolynomialFungsi teras berbilang fungsi,
    • Guassian KernelFunction Guassian KernelFunction / Radial BasisFunction RBF fungsi asas radial,
    • String KernelFunction (fungsi teras senar)
    • BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network/Bayesian Belief Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bayesian Network), BN (Bay
    • LDA ((Linear Discriminant Analysis/FisherLinear Discriminant), yang mana ia digunakan untuk mengkaji dan mengkaji kesesuaian dalam bidang analisis.
    • EL ((Ensemble Learning mengintegrasikan pembelajaran Boosting, Bagging, Stacking) dan EL ((Ensemble Learning mengintegrasikan pembelajaran Boosting, Bagging, Stacking) dan EL ((Ensemble Learning mengintegrasikan pembelajaran Boosting, Bagging, Stacking).
    • Adaptive Boosting (Peningkatan Beradaptasi)
    • MEM (Model Entropy Maksimum)
  • Evaluasi Kesan:

    • Confusion Matrix (Matrik Kekecohan)
    • Precision, Recall, dan lain-lain.
    • F-score (skor F) dan Accuracy (kecekapan)
    • ROC Curve, AUC, dan AUC
    • LiftCurve, KS Curve
  • PGM (Probabilistic Graphical Models):

    • BN ((Bayesian Network/Bayesian Belief Network/BeliefNetwork)
    • MC (Markov Chain) adalah sebuah blog yang mengkhususkan diri dalam blog Markov Chain.
    • HMM (Model Markov Tersembunyi)
    • MEMM (Model Maksimum Entropy Markov) ialah model enteri Markov maksimum.
    • CRF (Conditional Random Field), sebuah lapangan terbang bersesuaian dengan keadaan lapangan terbang.
    • MRF (Markov Random Field)
  • NN (Rangkaian Neural):

    • ANN (Rangkaian Neural Buatan)
    • BP ((Error BackPropagation)
  • DeepLearning

    • Auto-encoder (pengekod automatik)
    • SAE (Stacked Auto-encoders) adalah pengekod automatik yang ditumpuk.
    • Sparse Auto-encoders adalah pengekod automatik yang jarang digunakan.
    • Denoising Auto-encoders, pengekod automatik untuk menghapuskan bunyi.
    • Contractive Auto-encoders (Pengekod automatik kontraktif)
    • RBM (Restricted Boltzmann Machine) ialah sebuah mesin bertekanan Boltzmann terhad.
    • DBN (Rangkaian Kepercayaan mendalam)
    • CNN (ConvolutionalNeuralNetwork) adalah sebuah rangkaian saraf konvolusional yang telah dipasarkan di seluruh dunia.
    • Word2Vec (Model Pembelajaran Vektor Perkataan).
  • DimensionalityReduction (pengurangan dimensi):

    • LDA LinearDiscriminant Analysis/Fisher Linear Discriminant Analisis pembezaan linear
    • PCA (Analisis Komponen Utama)
    • ICA (Independent Component Analysis) adalah sebuah syarikat yang bergerak dalam bidang analisis komponen bebas.
    • SVD (Singular Value Decomposition) ialah penguraian nilai singular.
    • FA ((FactorAnalysis kaedah analisis faktor) }}.
  • Text Mining (Perlombongan Teks):

    • Model Ruang Vektor (VSM)
    • Word2Vec (model pembelajaran vektor perkataan)
    • TF (Term Frequency) ialah istilah untuk frekuensi frekuensi.
    • TF-IDF ((Term Frequency-Inverse DocumentFrequency) ialah frekuensi terbalik dokumen.
    • MI ((MutualInformation)) adalah sebuah blog yang mengkaji tentang isu-isu yang berkaitan dengan Islam.
    • ECE (Expected Cross Entropy) adalah sebuah platform yang menyediakan maklumat mengenai enteriori yang boleh dipercayai.
    • QEMI (Pengkalan Maklumat Sekunder)
    • IG ((InformationGain), sebuah laman web di Malaysia yang dikhaskan untuk blog dan blog.
    • IGR (Information Gain Ratio) ialah kadar keuntungan maklumat.
    • Gini, atau Pekali Gini.
    • x2 Statistic (((x2 statistik),
    • TEW (TextEvidence Weight) adalah sebuah laman web yang mengkhususkan diri dalam bidang teks.
    • OR ((Odds Ratio)), yang merupakan satu-satunya pilihan dalam pilihan raya ini.
    • N-Gram Model,
    • LSA (Latent Semantic Analysis) adalah kaedah yang digunakan untuk mengkaji dan mengkaji kata-kata dalam bahasa Inggeris.
    • PLSA ((ProbabilisticLatent Semantic Analysis) adalah analisis semantik laten berdasarkan kebarangkalian.
    • LDA ((Latent DirichletAllocation Model Dirichlet yang berpotensi) }}
  • Association Mining (Pertubuhan Perlombongan):

    • Apriori,
    • FP-growth (Frequency Pattern Tree Growth) ialah algoritma pertumbuhan pokok dengan corak frekuensi.
    • AprioriAll,
    • Spade。
  • Enjin Rekomendasi:

    • DBR (Demographic-based Recommendation) adalah cadangan berasaskan demografi yang dibuat oleh pengkaji.
    • CBR (Context-basedRecommendation) adalah satu kaedah yang digunakan untuk membuat cadangan berdasarkan konteks.
    • CF (Collaborative Filtering), sebuah laman web di Malaysia yang mengkhususkan diri dalam penyaringan kolaboratif.
    • UCF (User-based Collaborative Filtering Recommendation) adalah sebuah cadangan penapisan kolaboratif berasaskan pengguna.
    • ICF ((Item-based Collaborative Filtering Recommendation)
  • Similarity Measure & Distance Measure:

    • Jarak Euclidean
    • “Manhattan Distance” (Jarak Manhattan) adalah sebuah blog blog yang mengkaji mengenai isu-isu yang berkaitan dengan isu-isu yang berkaitan dengan pengebumian.
    • Jarak antara Chebyshev dan Chebokshev adalah kira-kira 100 km.
    • MinkowskiDistance (Jarak Minkowski) ialah jarak yang digunakan untuk mengesan jarak antara dua objek.
    • Jarak Euclidean Standardized
    • MahalanobisDistance (Jarak Mar)
    • “Cosine” ialah “Cosine” dan “Cosine” ialah “Cosine”.
    • HammingDistance/Edit Distance (Jarak Hamming/Jarak Edit)
    • JaccardDistance (Jarak Jaccard) adalah sebuah blog blog yang mengkaji mengenai isu ini.
    • Correlation Coefficient Distance (Jarak pekali hubungan)
    • InformationEntropy (Informasi Entropy) ialah sebuah blog yang diterbitkan oleh Google.
    • KL ((Kullback-Leibler Divergence KL Perbezaan/Relative Entropy relatif rendah) )
  • Feature Selection:

    • “Mutual Information” (Maklumat Bersama)
    • DocumentFrequence (Kebanyakan Dokumen)
    • Maklumat Mendapat (Information Gain)
    • Ujian Chi-squared
    • Gini (Kepantasan Gini)
  • Outlier Detection (algoritma pengesanan titik luar biasa):

    • Menurut beliau, ia adalah satu perkara yang tidak dapat difahami.
    • “Saya tidak tahu apa-apa tentang apa yang berlaku di Malaysia.
    • Density-based (berdasarkan ketumpatan),
    • Clustering-based (berdasarkan pengumpulan) [2].
  • Learning to Rank (berasaskan pembelajaran):

    • Pointwise:McRank;
    • Pairwise:RankingSVM,RankNet,Frank,RankBoost;
    • Listwise:AdaRank,SoftRank,LamdaMART。