- Forum
- Quantpedia
- Istilah yang biasa digunakan untuk pembelajaran mesin dan perlombongan data
Istilah yang biasa digunakan untuk pembelajaran mesin dan perlombongan data
Penulis:
Pencipta Kuantiti - Impian Kecil, Dicipta: 2017-03-20 09:58:22, Dikemas kini:
Istilah yang biasa digunakan untuk pembelajaran mesin dan perlombongan data
-
Sampling (Contoh):
- Pengambilan sampel rawak mudah
- Pengambilan sampel secara luar talian (K mungkin di luar talian, dll.)
- Pengambilan sampel dalam talian (K mungkin sampel dalam talian dan sebagainya)
- Ratio-based Sampling (Sampling secara rawak berdasarkan nisbah)
- Pengambilan sampel penerimaan-penolakan
- Importance Sampling (Contoh Kepentingan)
- MCMC ((MarkovChain Monte Carlo MarkovMont Carlo: Metropolis-Hasting & Gibbs)
-
Clustering (Kelaborasi):
- K bermaksud,
- K-Mediods,
- Dua mata K-means,
- FK-bererti,
- Canopy,
- Spektral-KMeans (Kumpulan Spektral)
- GMM-EM ((Menggabungkan model Gaussian - algoritma maksimum yang diharapkan diselesaikan))
- K-Pototypes, CLARANS (berdasarkan pembahagian)
- BIRCH (berdasarkan peringkat)
- CURE (berdasarkan peringkat)
- DBSCAN (berdasarkan ketumpatan)
- CLIQUE ((berdasarkan ketumpatan dan berasaskan grid) ).
-
Classification & Regression (Klasifikasi & Regresi):
- LR (Linear Regression)
- LR (Logistic Regression Logical Regression)
- SR (Softmax Regression mungkin regresi logik kelas)
- GLM (Generalized Linear Model) ialah model linear yang digunakan untuk merangkumi semua model linear.
- RR ((Ridge Regression Regression/L2 Regular Minimum 2x Regression),
- LASSO ((Least Absolute Shrinkage and Selectionator Operator L1 adalah kaedah regresi dua kali minimum))
- RF (Random Forest)
- DT (Pohon Keputusan)
- GBDT (Gradient Boosting Decision Tree) ialah sebuah pokok keputusan yang mempunyai gradien yang menurun.
- CART (ClassificationAnd Regression Tree) ialah pokok regresi klasifikasi.
- KNN (K-Nearest Neighbor)
- SVM ((Support VectorMachine),
- KF ((KernelFunction Fungsi Kernel PolynomialKernel Function Fungsi Kernel berbilang,
- Guassian KernelFunction Fungsi Kernel Gaussian/Radial BasisFunction Fungsi RBF
- String KernelFunction ()
- NB (Naive Bayes, Bayesian Network/Bayesian Belief Network/Belief Network), BN (Bayesian Network/Bayesian Belief Network/Belief Network)
- LDA (Linear Discriminant Analysis/FisherLinear Discriminant Analysis/Fisher Linear Discriminant Analysis) ialah kaedah analisis yang digunakan oleh ahli-ahli sains untuk mengenal pasti perbezaan antara jenis bahan yang digunakan dan jenis bahan yang digunakan.
- EL (Ensemble Learning Integration Learning Boosting, Bagging, Stacking) adalah sebuah platform pembelajaran yang mempunyai pelbagai jenis pembelajaran.
- AdaBoost (Adaptive Boosting) adalah sebuah aplikasi yang digunakan untuk meningkatkan kebolehan penyesuaian.
- MEM (Model Entropi Maksimum)
-
Penilaian Keberkesanan:
- Di sini, anda boleh melihat gambar yang menunjukkan bahawa anda telah berjaya.
- Perincian yang lebih tinggi ialah:
- Akurasi (kesesuaian), F-score (Skor F),
- ROC Curve (kurva ROC), AUC (area AUC),
- Lift Curve, KS Curve.
-
PGM (Probabilistic Graphical Models Probability Graph Model):
- BN (Bayesian Network/Bayesian Belief Network/BeliefNetwork)
- MC (Markov Chain)
- HMM (Hidden Markov Model)
- MEMM (Maximum Entropy Markov Model) ialah model yang digunakan untuk menentukan entropi maksimum.
- CRF (Conditional Random Field) ialah lapangan terbang rawak bersyarat.
- MRF ((Markov Random Field Markov Random Airport) ).
-
NN (Syarikat saraf):
- ANN (Artificial Neural Network) adalah sebuah rangkaian saraf buatan yang dicipta oleh seorang pakar dalam bidang sains dan teknologi.
- BP (Error BackPropagation) adalah satu kaedah yang digunakan untuk menyebarkan kesalahan ke arah belakang.
-
DeepLearning
- Auto-encoder (pengekod automatik)
- SAE (Stacked Auto-encoders) adalah satu set pengekod automatik yang ditumpuk.
- Sparse Auto-encoders adalah pengekod automatik yang jarang berlaku.
- Denoising Auto-encoders untuk menghalang pengekod automatik daripada membuat bunyi bising.
- Contractive Auto-encoders (pengekod automatik kontraktif)
- RBM (Restricted Boltzmann Machine) ialah mesin yang digunakan untuk menghidupkan dan mematikan mesin RBM.
- DBN (Deep Belief Network) adalah rangkaian kepercayaan mendalam yang mengkaji tentang agama Islam.
- CNN (Convolutional Neural Network) melaporkan bahawa seorang lelaki berusia 20 tahun, yang merupakan seorang ahli media, telah membunuh seorang wanita berusia 20 tahun.
- Word2Vec (Model Pembelajaran Vektor Kata) ⇒
-
DimensionalityReduction (pengurangan dimensi):
- LDA Linear Discriminant Analysis/Fisher Linear Discriminant
- PCA (Principal Component Analysis) ialah analisis komponen utama.
- ICA (Independent Component Analysis) ialah analisis komponen bebas yang dilakukan oleh sebuah syarikat yang berpangkalan di Singapura.
- SVD (Singular Value Decomposition) ialah satu-satunya bentuk penguraian nilai tunggal.
- FA (Faktor Analisis)
-
Text Mining (Pembijakan Teks):
- VSM (Vector Space Model)
- Word2Vec (Model Pembelajaran Vektor Kata)
- TF (Term Frequency)
- TF-IDF (Term Frequency-Inverse Document Frequency) ialah frekuensi terbalik dokumen yang digunakan untuk mencatatkan frekuensi terbalik.
- MI (MutualInformation) saling berhubung,
- ECE (Expected Cross Entropy) ialah entropy yang dijangkakan.
- QEMI (Bandar Maklumat Kedua)
- IG (InformationGain) - maklumat yang bertambah,
- IGR (Information Gain Ratio) ialah kadar keuntungan maklumat.
- Gini (penganjur Gini)
- x2 Statistic ((x2 jumlah statistik),
- TEW (TextEvidence Weight) adalah sebuah kumpulan media sosial yang mengkaji dan mengkaji maklumat yang terdapat dalam teks.
- OR (Rasio Kebarangkalian)
- Model N-Gram,
- LSA (Latent Semantic Analysis) ialah analisis semantik latent.
- PLSA (Probabilistic Latent Semantic Analysis, analisis semantik latent berdasarkan kebarangkalian)
- LDA (Laten Dirichlet Allocation, Model Dirichlet Potensial)
-
Association Mining (dalam bahasa Inggeris: Association Mining):
- Sebelum ini,
- FP-growth (Frequency Pattern Tree Growth) ialah algoritma pertumbuhan pokok berpattern frekuensi yang digunakan untuk menjana pertumbuhan pokok.
- AprioriAll,
- Spade.
-
Enjin Cadangan:
- DBR (Demographic-based Recommendation) adalah sebuah perlembagaan yang mengkaji dan mengkaji data yang berkaitan dengan populasi.
- CBR (Context-basedRecommendation) - Rekomendasi berasaskan kandungan
- CF (Collaborative Filtering ialah penapisan bersama)
- UCF (User-based Collaborative Filtering Recommendation) adalah sebuah kumpulan penapis kolaboratif berasaskan pengguna.
- ICF (Item-based Collaborative Filtering Recommendation) (Syarat penapisan kolaboratif berdasarkan projek)
-
Pengukuran Kesamaan & Pengukuran Jarak:
- Jarak Euclidean
- ManhattanDistance (Jarak Manhattan)
- Jarak Chebyshev (Jarak Chebyshev)
- Minkowski Distance (dalam bahasa Inggeris: Minkowski Distance)
- Jarak Euclidean Standard (Jarak Euclidean Standard)
- MahalanobisDistance (Jarak Mars)
- Kos (Cosine Consonant)
- HammingDistance/Edit Distance
- JaccardDistance (Jarak Jaccard)
- Jarak Gabungan (Correlation Coefficient)
- Di sini, anda boleh melihat beberapa gambar yang menarik.
- KL ((Kullback-Leibler Divergence KL dispersi/Relative Entropy relatif ketara) ).
-
Feature Selection (Algoritma Pilihan Ciri):
- Mutual Information (Mutual Information) adalah sebuah laman web yang ditubuhkan di Malaysia.
- DocumentFrequence (Frequency Dokumen)
- Di sini, anda boleh melihat beberapa gambar yang menarik.
- Ujian Chi-squared
- Gini (penganjur Gini)
-
Outlier Detection (Algoritma Pengesanan Titik Kebiasaannya):
- Statistik-based (berdasarkan statistik)
- Di sini, anda boleh melihat beberapa gambar yang berbeza.
- Density-based (berdasarkan ketumpatan)
- Clustering-based (Berdasarkan kumpulan).
-
Learning to Rank (Pengaturcaraan berdasarkan pembelajaran):
- Secara spesifik: McRank;
- Di peringkat pasangan: RankingSVM,RankNet,Frank,RankBoost;
- Dalam senarai: AdaRank,SoftRank,LamdaMART,..
Lebih lanjut
- Analisis aplikasi strategi perdagangan rasio besi, keluli dan besi
- Bagaimana untuk menganalisis kadar turun naik pilihan?
- Penggunaan program dalam pilihan
- Masa dan kitaran
- Mesin vektor sokongan di dalam otak
- Berbual-bual sebagai peniaga dan pembantu
- Jalan terdalam di dunia adalah jalan anda: menggali lubang-lubang di Tasik Sutli.
- Bacalah tentang teori kebarangkalian, statistik, dan lima hikmah yang paling mudah untuk difahami oleh orang ramai.
- Trilogi Pengurusan Kewangan: Format Pertama
- Saya tidak pernah menggunakan penggandaan untuk mendapatkan wang.
- Tidak meramalkan, hanya mencerminkan perubahan harga
- Ali Cloud Linux hoster menjalankan hoster, hoster dihidupkan semula, bagaimana untuk mendapatkan semula hoster asal?
- Jika anda mempunyai risiko tinggi, anda akan mempunyai risiko tinggi.
- Saya ingin bertanya, platform mana yang boleh disokong oleh platform mata wang maya dan apa yang boleh ditukar dengan mata wang maya.
- Pasaran Zero dan Negatif
- Strategi perdagangan frekuensi tinggi - berdagang dengan pilihan terbalik
- Jadilah seorang probabilistikus - bodoh yang membaca buku dan berkeliaran secara rawak.
- Probabiliti, kecacatan dan nilai positif yang diharapkan untuk perdagangan jangka panjang
- Jika anda mempunyai keraguan mengenai fungsi masa depan, mohon kepada Tuhan!
- Dana dan kredit dalam sistem perbankan wang