- Forum
- Quantpedia
- Istilah yang umum digunakan untuk pembelajaran mesin dan penambangan data
Istilah yang umum digunakan untuk pembelajaran mesin dan penambangan data
Penulis:
Penemu Kuantitas - Mimpi Kecil, Dibuat: 2017-03-20 09:58:22, Diperbarui:
Istilah yang umum digunakan untuk pembelajaran mesin dan penambangan data
-
Sampling (Contoh):
- Simple Random Sampling (Contoh acak sederhana)
- OfflineSampling (K-sampling mungkin offline, dll.)
- Online Sampling (K mungkin sampel online dll)
- Ratio-based Sampling (Sampling acak rasio yang sama)
- Acceptance-RejectionSampling (Sampling penerimaan-penolakan)
- Importance Sampling (Contoh Pentingnya)
- MCMC ((MarkovChain Monte Carlo MarkovMont Carlo Sampling Algorithm: Metropolis-Hasting & Gibbs) )).
-
Clustering (mengelompokkan):
- K berarti,
- K-Mediods,
- Dua poin K-Means,
- FK berarti,
- Canopy,
- Spektral-KMeans (Kelompok Spektral)
- GMM-EM (Mixed Gaussian Model - Diharapkan Algoritma Maksimalisasi Solusi)
- K-Pototypes, CLARANS (berdasarkan pembagian), dan K-Pototypes (berdasarkan pembagian).
- BIRCH (berdasarkan tingkat)
- CURE (berdasarkan tingkat)
- DBSCAN (berdasarkan kepadatan)
- CLIQUE (berdasarkan kepadatan dan berbasis grid) ⇒
-
Classification & Regression (Klasifikasi & Regresi):
- LR (Linear Regression)
- LR (Logistic Regression Logical Regression)
- SR (Softmax Regression mungkin regressi logika kelas),
- GLM (Generalized Linear Model) adalah sebuah model linear dalam arti luas.
- RR ((Ridge Regression) Regression R/L2 Regular Minimum 2x Regression),
- LASSO (Least Absolute Shrinkage and Selectionator Operator L1 adalah regulasi regresi minimal dua kali lipat)
- RF (Hutan acak)
- DT (DecisionTree) adalah sebuah pohon keputusan yang dibangun oleh para pembuat keputusan.
- GBDT (Gradient Boosting Decision Tree) adalah pohon keputusan yang memiliki gradien yang menurun.
- CART (ClassificationAnd Regression Tree) adalah sebuah pohon klasifikasi regresi yang digunakan untuk mengidentifikasi jenis-jenis pohon yang dapat diklasifikasikan.
- KNN ((K-Nearest Neighbor K dekat tetangga),
- SVM (Support VectorMachine),
- KF ((KernelFunction) Fungsi Kernel PolynomialKernel Function Fungsi Kernel dengan bentuk multipolar,
- Guassian KernelFunction Fungsi Gaussian Kernel/Radial BasisFunction Fungsi RBF
- String KernelFunction (fungsi inti string)
- NB (Naive Bayes, Bayesian Network/Bayesian Belief Network/Belief Network)
- LDA (Linear Discriminant Analysis/FisherLinear Discriminant Analysis/Fisher Linear Discriminant Analysis) adalah sebuah metode yang digunakan oleh para peneliti untuk mendeteksi perbedaan dalam analisis linier.
- EL (Ensemble Learning Integration Learning) adalah sebuah aplikasi pembelajaran yang berbasis pada bahasa Inggris.
- Ada Boost (Adaptive Boosting) adalah sebuah aplikasi yang digunakan untuk meningkatkan kemampuan adaptasi.
- MEM (Model Entropi Maksimum)
-
Efektivitas Evaluasi:
- Di sini kita akan melihat beberapa contoh yang bisa kita gunakan untuk mencari tahu apakah ada yang benar atau salah.
- Precision (keakuratan), Recall (tingkat penarikan),
- Accuracy (keakuratan), F-score (skor F),
- ROC Curve (kurva ROC), AUC (area AUC),
- LiftCurve, KS Curve.
-
PGM (Probabilistic Graphical Models Probability Chart Model):
- BN ((Bayesian Network/Bayesian Belief Network/BeliefNetwork Jaringan Bayesian/Jaringan Keyakinan Bayesian/Jaringan Keyakinan Bayesian),
- MC (Markov Chain) adalah sebuah jaringan yang terdiri dari dua bagian, yaitu:
- HMM (Hidden Markov Model) adalah sebuah model yang dibuat oleh para ilmuwan di Amerika Serikat.
- MEMM (Maximum Entropy Markov Model) adalah sebuah model yang digunakan untuk mendeteksi entropy yang tinggi.
- CRF (Conditional Random Field) adalah sebuah lapangan terbang acak kondisional.
- MRF ((Markov Random Field di Markov Random Airport) ).
-
NN (jaringan saraf):
- ANN (Artificial Neural Network) adalah sebuah jaringan saraf buatan yang digunakan oleh para ilmuwan untuk mendeskripsikan sistem saraf otak manusia.
- BP (Error BackPropagation) adalah salah satu dari dua jenis penularan yang terjadi di Indonesia.
-
DeepLearning
- Auto-encoder (pengenkode otomatis)
- SAE (Stacked Auto-encoders) adalah sebuah sistem pengenkodean otomatis yang ditumpuk.
- Sparse Auto-encoders adalah encoder otomatis yang langka.
- Denoising Auto-encoders untuk membuat encoder otomatis berisik.
- Contractive Auto-encoders (penyempitan pengenkode otomatis)
- RBM (Restricted Boltzmann Machine) adalah sebuah mesin yang digunakan untuk mendeteksi dan mendeteksi gelombang listrik.
- DBN (Deep Belief Network) adalah jaringan kepercayaan yang berbasis di Indonesia.
- CNN (Convolutional Neural Network) adalah sebuah media sosial yang berbasis di Amerika Serikat.
- Word2Vec (Model Pembelajaran Vektor Kata)
-
DimensionalityReduction (pengurangan dimensi):
- LDA Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/LDA Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis
- PCA (Principal Component Analysis) adalah analisis komponen utama.
- ICA (Independent Component Analysis) adalah analisis komponen independen.
- SVD (Singular Value Decomposition) adalah suatu metode yang digunakan untuk mendeskripsikan nilai-nilai yang berbeda.
- FA (Faktor Analisis)
-
Text Mining (Mining Teks):
- VSM (Vector Space Model)
- Word2Vec (Model Pembelajaran Vektor Kata)
- TF (Term Frequency)
- TF-IDF (Term Frequency-Inverse Document Frequency) adalah frekuensi terbalik dari sebuah dokumen.
- MI (MutualInformation) saling berkirim pesan.
- ECE (Expected Cross Entropy) adalah entropy yang diharapkan pada suatu entropy.
- QEMI (Bandar Informasi Sekunder)
- IG (Information Gain) adalah sebuah situs web yang menyediakan informasi yang bermanfaat.
- IGR (Information Gain Ratio) adalah rasio keuntungan informasi yang meningkat.
- Gini (koefisien Gini)
- x2 Statistic ((x2 jumlah statistik),
- TEW (TextEvidence Weight) adalah sebuah organisasi yang berbasis di Amerika Serikat.
- OR (Odds Ratio) Rasio Keunggulan,
- Model N-Gram,
- LSA (Latent Semantic Analysis) adalah bahasa yang digunakan untuk analisis semantik latent.
- PLSA (Probabilistic Latent Semantic Analysis) adalah analisis semantik latent yang didasarkan pada probabilitas.
- LDA (Laten Dirichlet Allocation, model Dirichlet potensial)
-
Asosiasi Pertambangan:
- Sebelumnya,
- FP-growth (Frequency Pattern Tree Growth) adalah algoritma pertumbuhan pohon bertipe frekuensi yang digunakan oleh para peneliti untuk mempelajari pertumbuhan pohon.
- AprioriAll,
- Spade.
-
Recommendation Engine (mesin rekomendasi):
- DBR (Demographic-based Recommendation) adalah sebuah rekomendasi berbasis demografi yang ditujukan kepada para pekerja yang bekerja di sektor perkebunan.
- CBR (Context-basedRecommendation) adalah rekomendasi berdasarkan konten yang dibuat oleh para penulis dan penulis.
- CF (Collaborative Filtering) adalah sebuah aplikasi untuk menyaring konten yang ada di media sosial.
- UCF (User-based Collaborative Filtering Recommendation) adalah sebuah organisasi yang berbasis di Amerika Serikat.
- ICF (Item-based Collaborative Filtering Recommendation) adalah rekomendasi untuk penyaringan kolaboratif berdasarkan proyek.
-
Similarity Measure & Distance Measure (Pengukuran Kesamaan dan Jarak):
- Jarak Euclidean (Jarak Eropa)
- Perjalanan ini dilakukan oleh seorang pria yang dikenal sebagai "Manhattan Distance" (jarak Manhattan).
- Chebyshev Distance (Jarak dari Chebyshev)
- Minkowski Distance (dalam bahasa Inggris: Minkowski Distance)
- Standardized Euclidean Distance (Jarak Euclidean Standardized)
- Di sini, Anda dapat melihat beberapa gambar yang menarik dari situs web ini.
- Cos (kekuatan cosine)
- HammingDistance/Edit Distance (dalam bahasa Inggris).
- Jaccard Distance (JD) adalah sebuah video yang dibuat oleh seorang blogger bernama Jaccard.
- Correlation Coefficient Distance (jarak koefisien korelasi)
- Informasi Entropy (dalam bahasa Inggris: Information Entropy)
- KL ((Kullback-Leibler Divergence KL dispersi/Relative Entropy relatif kuat) ).
-
Feature Selection (Algorithm Pemilihan Fitur):
- Mutual Information (Informasi bersama)
- DocumentFrequence (frekuensi dokumen)
- Informasi Gain (Mendapatkan Informasi)
- Test Chi-squared (tes sisi kartu)
- Gini (koefisien Gini)
-
Outlier Detection (Algoritma Deteksi Titik Keanehan):
- Pernyataan ini disampaikan oleh seorang wartawan yang juga anggota DPR RI.
- "Distance-based" (berdasarkan jarak)
- Density-based (dasar kepadatan)
- Clustering-based (berdasarkan kelompok).
-
Belajar untuk Peringkat:
- Secara spesifik: McRank;
- Perkalian:RankingSVM,RankNet,Frank,RankBoost;
- AdaRank,SoftRank,LamdaMART,..
Lebih banyak
- Analisis Aplikasi Strategi Perdagangan Rasio Besi, Besi dan Logam
- Bagaimana cara menganalisis volatilitas opsi?
- Aplikasi programatisasi pada opsi
- Waktu dan Periode
- Mesin vektor pendukung di otak
- Berbicara sebagai penjual dan pemegang saham
- Jalan terdalam di dunia adalah jalanmu: menggali lubang-lubang di danau Sutli.
- Baca Probabilitas, Statistik, dan Lima Tip Kecerdasan yang Paling Sederhana dari Teori Probabilitas
- Trilogi Pengelolaan Dana: Format Pertama
- Saya tidak pernah menggunakan perkalian untuk menghasilkan uang.
- Tidak memprediksi, hanya mencerminkan perubahan harga
- Ali Cloud Linux host sedang menjalankan host, host tersebut di restart, bagaimana cara mendapatkan kembali host aslinya?
- Investasi nilai memiliki definisi risiko yang berbeda dari yang Anda pikirkan.
- Saya ingin bertanya, platform apa yang dapat didukung oleh mesin virtual currency dan transaksi mata uang apa saja yang dapat didukung oleh mesin virtual currency?
- Pasar Zero dan Negatif
- Strategi perdagangan frekuensi tinggi - melakukan perdagangan pasar dan memilih kebalik
- Jadilah seorang probabilist - orang bodoh yang membaca buku dan berkeliaran secara acak.
- Probabilitas, peluang, dan nilai positif yang diharapkan untuk perdagangan jangka panjang
- Jika Anda memiliki keraguan tentang fungsi masa depan, mohon kepada Allah!
- Dana dan kredit dalam sistem perbankan moneter