- Форумы
- Квантпедия
- Часто используемые термины для машинного обучения и добычи данных
Часто используемые термины для машинного обучения и добычи данных
Автор:
Изобретатели количественного измерения - мечты, Создано: 2017-03-20 09:58:22, Обновлено:
Часто используемые термины для машинного обучения и добычи данных
-
Sampling (выборка):
- Simple Random Sampling (Простое рандомирование)
- OfflineSampling (возможно, K-выборка в автономном режиме и т.д.)
- Онлайн-выборка (возможно, K-выборка онлайн и т.д.)
- Ratio-based Sampling (Распорное рандомизирование)
- Принятие-отторжение выборки
- Примечание:
- MCMC ((MarkovChain Monte Carlo Марковский алгоритм выборки Монте-Карло: Metropolis-Hasting & Gibbs))).
-
Clustering (группировка):
- К-означает,
- К-средний,
- Второй пункт K-Means,
- FK-значит,
- Покрывало,
- Спектр-KMeans (Спектр-KMeans)
- GMM-EM ((Гибридная модель Гаусса - ожидаемое решение алгоритма максимизации))
- К-Пототипы, КЛАРАНС (на основе классификации)
- BIRCH (по уровню)
- CURE (по уровню)
- DBSCAN (на основе плотности)
- CLIQUE (на основе плотности и на основе решетки).
-
Classification & Regression (Классификация и регрессия):
- LR (линейная регрессия)
- LR (Логистическая регрессия логической регрессии)
- SR (Softmax Regression, возможно, логическое регрессирование классов)
- GLM (Generalized Linear Model) - генерализованная линейная модель в широком смысле.
- RR (Ridge Regression) - регрессия рентабельности/L2 - регулярная минимальная двойная регрессия)
- LASSO ((Least Absolute Shrinkage and Selectionator Operator L1 правильный минимальный двукратный регресс))
- RF (Рассказ о лесах)
- DT (DecisionTree) - дерево решения, созданное в 2010 году.
- GBDT (Gradient Boosting Decision Tree) - дерево решения с понижающимся градиентом.
- CART (ClassificationAnd Regression Tree) - классификационный регрессионный дерево.
- KNN ((K-Nearest Neighbor K-ближайший сосед),
- SVM ((поддержка VectorMachine),
- KF ((KernelFunction) Ядерная функция PolynomialKernel Function, многопольная ядерная функция,
- Guassian KernelFunction Гауссианская ядерная функция/Радиальная BasisFunction RBF диаметр к базе,
- String KernelFunction (Страничная ядровая функция)
- NB (Naive Bayes, Bayesian Belief Network, Belief Network, Bayesian Network, Bayesian Belief Network) (Байесовская сеть) (Байесовская сеть)
- LDA ((Linear Discriminant Analysis/FisherLinear Discriminant Analysis/FisherLinear Discriminant Analysis) - анализ линейного дискриминатора, выполненный с помощью линейного дискриминатора, который используется для определения линейного дискриминатора, или для определения линейного дискриминатора, выполненного с помощью линейного дискриминатора.
- EL (Ensemble Learning) интегрирует обучение Boosting, Bagging, Stacking и другие.
- AdaBoost (Адаптивный Boosting) - это программа, которая позволяет пользователям улучшать свои привычки.
- MEM (максимальная энтропическая модель).
-
Effectiveness Evaluation (Оценка эффективности):
- В этом случае, если вы не хотите, чтобы ваш ребенок был сбит с толку, вы должны быть готовы.
- Прецизия (точность), Recall (скорость отзыва),
- Показатели: Accuracy (точность), F-score (F-баллы),
- ROC Curve (ROC кривая), AUC (AUC площадь),
- LiftCurve, KS Curve (Крёстная кривая)
-
PGM (Probabilistic Graphical Models) - вероятностная диаграмма моделей:
- BN ((Bayesian Network/Bayesian Belief Network/BeliefNetwork) Сеть Байеса / Сеть убеждений Байеса / Сеть убеждений Байеса)
- MC (Markov Chain) - Марковская цепь,
- HMM (Скрытая модель Маркова)
- MEMM (Maximum Entropy Markov Model) - модель максимальной энтропии Маркова.
- CRF (Conditional Random Field) - условия случайного полета.
- MRF ((Markov Random Field) Марковский случайный аэропорт) ⇒
-
Нейронная сеть:
- В частности, он рассказал о том, как в 2010 году он был арестован в Нью-Йорке.
- BP (Error BackPropagation) (Ошибка обратного распространения).
-
Глубокое обучение
- Авто-енкодер (авто-кодер),
- SAE (Stacked Auto-encoders) - набор автокодеров, которые настраиваются на одном устройстве.
- Спарс Auto-encoders - редкий автоматический кодер.
- В этом случае, если вы хотите, чтобы ваш компьютер был более безопасным, вы можете использовать его в качестве инструмента.
- Contractive Auto-encoders (сокращенные авто-кодеры)
- RBM (Restricted Boltzmann Machine) - ограниченный Болтсманский аппарат.
- В частности, в сети "DBN" (Deep Belief Network) сообщается о том, что ученые пытаются доказать свою правоту.
- CNN (Convolutional Neural Network) рассказывает о том, как в 2010 году в Нью-Йорке появилась новая сеть, называемая "Конвулсионная нейронная сеть".
- Word2Vec ((слововекторная модель обучения) ).
-
DimensionalityReduction (Снижение измерений):
- LDA Linear Discriminant Analysis/Fisher Linear Discriminant Анализ линейного дискриминатора/Фишер линейного дискриминатора
- PCA (Principal Component Analysis) (Анализ основных компонентов)
- ICA (Independent Component Analysis) - независимый компонентный анализ.
- SVD (Singular Value Decomposition) - уникальное расщепление значения, которое происходит в течение одного дня.
- FA (Факторный анализ).
-
Text Mining (Текстовое майнинг):
- VSM (векторная модель пространства)
- Word2Vec (слово-векторная модель обучения)
- TF (Term Frequency)
- TF-IDF ((Term Frequency-Inverse DocumentFrequency) - частота слов-в обратном направлении документа),
- Миссия по взаимной информации (Mutual Information)
- ECE (Expected Cross Entropy) - ожидаемый кросс-энтропический параметр.
- QEMI (вторичный информационный канал)
- IG (Information Gain) - информационный прирост.
- ИГР (Information Gain Ratio - соотношение доходов от получения информации)
- Число гини (коэффициент Кини)
- x2 Statistic ((x2 статистические показатели),
- TEW (TextEvidence Weight) - право на доказательство текста.
- ОР (отношение шансов)
- Модель N-Gram,
- LSA (Latent Semantic Analysis) - несуществующий семантический анализ.
- PLSA (Probabilistic Latent Semantic Analysis) - вероятностно-основанный потенциальный семантический анализ.
- LDA (Latent Dirichlet Allocation, потенциальная модель Дирихле)
-
Association Mining (связанные с добычей):
- Прежде всего,
- FP-growth (Frequency Pattern Tree Growth) - алгоритм роста деревьев с частотным паттерном.
- Прежде всего,
- Пика.
-
Рекомендационная система:
- DBR (Demographic-based Recommendation) (Демографическая рекомендация) - это рекомендация, основанная на демографической статистике.
- CBR (Context-basedRecommendation) - рекомендация, основанная на содержании.
- CF (Collaborative Filtering - совместное фильтрация)
- UCF (User-based Collaborative Filtering Recommendation) - рекомендация по совместному фильтрации, основанная на пользователях.
- ICF (Item-based Collaborative Filtering Recommendation) (Рекомендации по совместному фильтрации на основе элементов).
-
Similarity Measure&Distance Measure (Меры сходства и расстояния):
- Евклидовое расстояние
- ManhattanDistance (англ. Расстояние до Манхэттена)
- В результате, он был вынужден отказаться от участия в выборах.
- MinkowskiDistance (отрыв от Минковского)
- Standardized Euclidean Distance (Стандартизированное евклидовое расстояние)
- Махаланобис Дистанция (от Марса)
- Кос (косиновая струна)
- HammingDistance/Edit Distance (англ. HammingDistance/Edit Distance) - расстояние, на котором можно редактировать текст.
- Якорд Дистанция (Jaccard Distance)
- Корреляционный коэффициент расстояния
- "Информационная энтропия" (англ. Information Entropy)
- KL ((Kullback-Leibler Divergence KL расхождение/Относительная энтропия относительно дивергенции)).
-
Feature Selection (альгоритм выбора функций):
- Встречается с одним из самых известных людей в мире.
- DocumentFrequence (частота документа)
- Например, в Китае, в Китае, в Китае, в Китае, в Китае, в Китае.
- В результате вы получите более высокую оценку, чем вы ожидали.
- Gini (коэффициент Кини)
-
Outlier Detection (Альгоритм обнаружения отклонений):
- Statistic-based (основанная на статистике)
- Например, в Китае, в Китае, в Китае, в Китае, в Китае, в Китае.
- Density-based (на основе плотности)
- Clustering-based (основанное на кластеризации)
-
Learning to Rank (Сортировка на основе обучения):
- В смысле: Макранк;
- Парально: RankingSVM,RankNet,Frank,RankBoost;
- В списке: AdaRank, SoftRank, LamdaMART.
Больше
- Анализ применения стратегии торговли шрубовой сталью, железными рудами
- Как анализировать колебания опционов?
- Программирование применения опционов
- Время и цикл
- Поддерживающая векторальная машина в мозге
- Общаться, быть продавцом и матерью
- Самая глубокая дорога в мире - это твоя схема: выкопать глубокие ямы в озере Сути.
- Читать вероятности статистики переходный барьер и пять хитростей простейшей теории вероятности, о которой никто не думал
- Трилогия управления финансами: формат первым
- Я никогда не делаю умножения.
- Не прогнозируйте, просто отражайте изменения цен.
- Новый хостинг Ali Cloud Linux запустил хостинг, хост перезапустился, как вернуть исходный хост?
- Высокая волатильность означает высокий риск.
- Я хотел бы спросить, какие платформы поддерживают виртуальные валютные диски и какие валютные транзакции.
- Новые рынки, новые рынки
- Стратегия высокочастотного трейдинга - торговать и выбирать обратно
- Быть вероятностником - дурак, который читает и блуждает
- Ожидаемые положительные значения вероятности, неточности и долгосрочных сделок
- Если у вас есть сомнения относительно будущих функций, прошу вас, боги!
- Финансы и кредиты в денежно-кредитной банковской системе