Allgemeine Begriffe für maschinelles Lernen und Datenmining

Schriftsteller:Die Erfinder quantifizieren - Kleine Träume, Erstellt: 2017-03-20 09:58:22, aktualisiert:

Allgemeine Begriffe für maschinelles Lernen und Datenmining

  • Sampling (Sample):

    • Einfaches Zufallssampeln
    • Offline-Sampling (K-Sampling möglicherweise offline)
    • Online Sampling (K-Sampling möglicherweise online usw.)
    • Ratio-based Sampling (Ratio-basierte Probenahme)
    • Es gibt eine Reihe von Methoden, um die Ablehnung von Proben zu verhindern, und es gibt viele Methoden, um die Ablehnung von Proben zu verhindern.
    • Wichtigkeitssampling
    • MCMC ((MarkovChain Monte Carlo Markov-Mont Carlo-Sampling-Algorithmen: Metropolis-Hasting & Gibbs)) ist eine der wichtigsten Methoden, um die Anzahl der Proben zu bestimmen.
  • Clustering (Clustern):

    • Das bedeutet:
    • K-Medioden,
    • Zwei Punkte K-Means.
    • FK-Mean,
    • Schirmfläche
    • Spectral-KMeans ist ein Spektral-Clustering-Programm, welches sich mit der Entwicklung von Spektral-KMeans beschäftigt.
    • GMM-EM ((Hybrid Gaussian Modell - erwartete Lösung durch Maximierungsalgorithmen))
    • K-Pototypes, CLARANS (basierend auf der Klassifizierung)
    • BIRCH (WEB basiert auf der Stufe.
    • CURE (basierend auf der Stufe)
    • DBSCAN (basierend auf der Dichte)
    • CLIQUE ((Dichte und Gitter basiert)).
  • Classification & Regression (Klassifizierung und Regression):

    • LR (Lineare Regression)
    • Das ist eine Art Logische Regression, eine Art Logische Regression.
    • SR (Softmax Regression, vielleicht Klassenlogik Regression)
    • Das GLM (Generalized Linear Model) ist ein allgemeines lineares Modell, das sich mit der Entwicklung von Linienmodellen befasst.
    • RR (Ridge Regression-Rückführung/L2-Regelmäßige Mindest-Zweifache-Rückführung)
    • LASSO (Least Absolute Shrinkage and Selectionator Operator L1 regelt die minimale Zweifachregression)
    • RF (Zufallswald)
    • DT (DecisionTree) ist ein Entscheidungsträufer, der sich für die Entwicklung von Lösungen einsetzt.
    • GBDT (Gradient Boosting Decision Tree) ist ein Gradient-Boosting-Decision-Tree, der sich durch die Entwicklung von Gradient-Boosting-Decision-Trees durch die Entwicklung von Gradient-Boosting-Decision-Trees durch die Entwicklung von Gradient-Boosting-Decision-Trees ausdrückt.
    • CART (ClassificationAnd Regression Tree) ist ein Regressionsbaum, der sich auf die verschiedenen Arten von Regressionsbaumen bezieht.
    • KNN (K-Nearest Neighbor K in der Nähe)
    • SVM (Support VectorMachine),
    • KF ((KernelFunction Kernelfunktion PolynomialKernel Function Kernelfunktion in mehrfacher Form,
    • Guassian KernelFunction Die Gaussian-Kernelfunktion/Radial BasisFunction RBF ist eine Radial-Basis-Funktion, die von der Basis ausgeht.
    • String KernelFunction (String-Kernelfunktion)
    • NB (Naive Bayes, Bayesian Belief Network, Belief Network, Bayesian Network, Bayesian Belief Network, Bayesian Belief Network, Bayesian Belief Network, Bayesian Belief Network, Bayesian Belief Network, Bayesian Belief Network, Bayesian Belief Network, Bayesian Belief Network, Bayesian Belief Network, Bayesian Belief Network, Bayesian Belief Network) Die Bewegung der Bewegung der Bewegung der Bewegung der Bewegung der Bewegung der Bewegung der Bewegung der Bewegung der Bewegung der Bewegung.
    • LDA (Linear Discriminant Analysis/FisherLinear Discriminant Analysis/Fisher Linear Discriminant Analysis) ist eine Methode, mit der die Ergebnisse der Analyse der LDA-Lineen ermittelt werden.
    • EL (Ensemble Learning integriert das Lernen von Boosting, Bagging, Stacking) ist ein Programm, das sich auf die Entwicklung von Lernmethoden auswirkt.
    • AdaBoost (Adaptive Boosting) ist eine Software, die von den Entwicklern entwickelt wurde.
    • MEM (Maximum-Entropy-Modell)
  • Effektivitätsbewertung:

    • Das ist eine Art "Confusion Matrix".
    • Sie sind in der Lage, sich zu verständigen, um zu wissen, ob sie sich in der Lage fühlen, sich zu verständigen oder nicht.
    • Die Ergebnisse der Studie zeigen, dass die Ergebnisse der Studie sehr unterschiedlich sind.
    • ROC-Kurve, AUC-Fläche
    • LiftCurve, KS-Kurve, KS-Kurve, KS-Kurve, KS-Kurve, KS-Kurve, KS-Kurve, KS-Kurve, KS-Kurve, KS-Kurve, KS-Kurve, KS-Kurve, KS-Kurve, KS-Kurve
  • PGM (Probabilistic Graphical Models Probabilitätsdiagrammmodell):

    • BN (Bayesian Network/Bayesian Belief Network/BeliefNetwork Bayesian Network/Bayesian Belief Network/Glaubensnetzwerk) ist ein Netzwerk, das sich mit der Bewegung der Bewegung beschäftigt.
    • MC (Markov-Kette)
    • HMM (Hidden Markov Modell) ist ein Markov-Modell, welches sich in den letzten zehn Jahren in den USA entwickelt hat.
    • MEMM (Maximum Entropy Markov Model) ist ein Markov-Modell, das sich durch die Erhöhung der Entropy-Einheiten und die Erhöhung der Entropy-Einheiten erstreckt.
    • CRF (Conditional Random Field) ist ein Flughafen, der in der Provinz Ljubljana, in der Provinz Ljubljana, in den USA, untergebracht ist.
    • MRF (Markov Random Field, Markov Random Airport) ist ein Flughafen in der Stadt Markov.
  • Ich bin der Meinung, dass es nicht möglich ist, das Problem zu lösen.

    • Das ist ein sehr schwieriges Problem, das wir uns stellen müssen.
    • BP (Error BackPropagation) ist eine Website, die sich mit dem Thema "Error BackPropagation" beschäftigt.
  • DeepLearning

    • Auto-Encoder (automatisierter Coder)
    • SAE (Stacked Auto-encoders) ist ein Stack von automatischen Encodern.
    • Sparse Auto-encoders sind ein seltener, automatischer Encoder, der sich in den letzten Jahren in den Vereinigten Staaten entwickelt hat.
    • Denoising Auto-encoders, die automatische Encoder zum Lärm bringen
    • Die Konstruktion der Konstruktion der Konstruktion der Konstruktion der Konstruktion der Konstruktion
    • RBM (Restricted Boltzmann Machine) ist eine Maschine, die für die Herstellung von Boltzmann-Maschinen verwendet wird.
    • Die DBN (Deep Belief Network) ist ein Netzwerk von Menschen, die sich für ihre Glaubensvorstellungen einsetzen.
    • CNN (Convolutional Neural Network) ist ein Netzwerk, das sich mit der Entwicklung von Konvolutionen befasst.
    • Word2Vec (Wort-Vektor-Lernmodell)
  • DimensionalityReduction (Dimensionalsenkung):

    • LDA Linear Discriminant Analysis/Fisher Linear Discriminant Analysis/Fisher Linear Discriminant Analysis ist eine Methode zur Analyse von Lineardiscriminanten.
    • PCA (Principal Component Analysis) ist eine Methode zur Analyse von Hauptkomponenten.
    • ICA (Independent Component Analysis) ist eine Organisation, die sich für die Analyse von unabhängigen Komponenten einsetzt.
    • SVD (Singular Value Decomposition) ist ein Symbol für die Singularität der Werte.
    • Factor Analysis (FA) ist eine Methode zur Faktoranalyse.
  • Text Mining (Text Mining) ist ein Netzwerk, das sich mit dem Thema "Text Mining" beschäftigt.

    • VSM (Vektor-Raummodell)
    • Word2Vec (Wort-Vektor-Lernmodell) ist ein Programm, das sich mit dem Lernen von Wörtern befasst.
    • TF (Term Frequency)
    • TF-IDF (Term Frequency-Inverse Document Frequency) ist ein Dokument, das in der Regel mit einer Zeichnungsfrequenz verglichen wird.
    • Ich bin ein großer Freund von den Menschen, die in der Welt leben.
    • ECE (Expected Cross Entropy) ist ein System, welches sich durch die Erwartung von Kreuzentropie auswirkt.
    • QEMI (Secondary Information Monitors) ist ein Netzwerk, das sich mit der Entwicklung von Medien beschäftigt.
    • IG (Information Gain) ist ein Netzwerk, das sich mit dem Thema "Information Gain" beschäftigt.
    • Der IGR (Information Gain Ratio) ist ein System, mit dem sich die Informationen verbreiten.
    • Gini (Kini-Koeffizient)
    • Das ist eine sehr schwierige Sache.
    • TEW (TextEvidence Weight) ist ein Medium, das sich für die Beweislage von Texten einsetzt.
    • Oder (Odds Ratio)
    • N-Gram-Modell,
    • LSA (Latent Semantic Analysis) ist eine Methode, um die Bedeutung von Begriffen zu ermitteln.
    • PLSA (Probabilistic Latent Semantic Analysis) ist eine vermutliche semantische Analyse, die auf Wahrscheinlichkeiten basiert.
    • LDA (Latent Dirichlet Allocation) ist ein potenzielles Dirichlet-Allocation-Modell.
  • Association Mining (linked mining):

    • Vorab:
    • FP-Growth (Frequency Pattern Tree Growth) ist ein Algorithmus für das Wachstum von Frequenz-Trees.
    • Vor allem,
    • Spade.
  • Empfehlungs-Engine:

    • DBR (Demographic-based Recommendation) ist eine demografisch-basierte Empfehlung, die von der Regierung der Vereinigten Staaten veröffentlicht wurde.
    • CBR (Context-based Recommendation) ist ein Kontext-basierter Empfehlungsbeitrag, der sich auf die Nutzung von Content-basierten Empfehlungen konzentriert.
    • CF (Collaborative Filtering) ist ein gemeinsames Filter, welches sich in den letzten zehn Jahren in den USA etabliert hat.
    • UCF (User-based Collaborative Filtering Recommendation) ist ein US-amerikanisches Netzwerk, das sich für die Zusammenarbeit von Filtern mit anderen Netzwerken einsetzt.
    • ICF (Item-based Collaborative Filtering Recommendation) ist ein gemeinsames Filter-Programm, das sich auf die Entwicklung von Projekten stützt.
  • Ähnlichkeitsmessung und Entfernungsmessung:

    • Die Euklidische Entfernung
    • Die Strecke ist in der Nähe von Manhattan.
    • Die Entfernung von Chebyshev (nach Tschebichev)
    • Die Minkowski-Distanz ist ein weiterer Weg, um die Grenze zu erreichen.
    • Standardisierte euklidische Entfernung
    • Mahalanobis Distanz (Mars Entfernung)
    • Das ist ein sehr schwieriges Problem.
    • HammingDistance/Edit Distance (Hamming-Distanz/Edit-Distanz) ist eine Funktion, die von einem Computer verwendet wird.
    • Jaccard-Distanz ist eine der wichtigsten Wege, um die Menschen zu erreichen.
    • Die Korrelationskoeffizienten entfernen sich von der
    • InformationEntropy ist ein Netzwerk, das sich mit der Entwicklung von Informationen beschäftigt.
    • KL ((Kullback-Leibler Divergence KL-Sprengung/Relative Entropy ist relativ schwierig) ).
  • Feature Selection (Algorithmus zur Auswahl von Merkmalen):

    • Ich bin der Meinung, dass es eine gute Idee ist.
    • Dokumentfrequenz (Dokumentfrequenz) ist eine Funktion, die von den Benutzern genutzt wird.
    • Information Gain (Informationsgewinn) ist eine neue Art von Kommunikation.
    • Der Chi-Quadrat-Test ist ein Test, bei dem die Ergebnisse der ersten Testphase in einem Teil der Studie festgestellt wurden.
    • Gini ist der Gini-Koeffizient.
  • Ausserordentliche Detektion:

    • Ich bin der Ansicht, dass es eine gute Idee ist, diese Frage zu beantworten.
    • Sie sind in der Lage, sich zu verständigen.
    • Das ist eine sehr schwierige Aufgabe.
    • Clustering-basiert.
  • Learning to Rank (Sortierung basierend auf dem gelernten):

    • Punktweise: McRank;
    • In Paaren:RankingSVM,RankNet,Frank,RankBoost;
    • In der Liste: AdaRank, SoftRank, LamdaMART.

Weitere Informationen