- ফোরাম
- কোয়ান্টপিডিয়া
- মেশিন লার্নিং এবং ডেটা মাইনিং সম্পর্কিত সাধারণ শব্দ
মেশিন লার্নিং এবং ডেটা মাইনিং সম্পর্কিত সাধারণ শব্দ
লেখক:
উদ্ভাবকগণ - ক্যোটিফিকেশন - ছোট্ট স্বপ্ন, তৈরিঃ 2017-03-20 09:58:22, আপডেটঃ
মেশিন লার্নিং এবং ডেটা মাইনিং সম্পর্কিত সাধারণ শব্দ
-
স্যাম্পলিংঃ
- সাধারণ র্যান্ডম স্যাম্পলিং (Simple Random Sampling)
- অফলাইন স্যাম্পলিং (অফলাইন ইত্যাদি হতে পারে)
- অনলাইন স্যাম্পলিং (অনলাইন ইত্যাদি হতে পারে)
- Ratio-based Sampling (অংশীদার ভিত্তিক র্যান্ডম স্যাম্পলিং)
- Acceptance-RejectionSampling (অনুমোদন-প্রত্যাখ্যান নমুনা)
- গুরুত্বপূর্ণতা নমুনা
- MCMC ((MarkovChain Monte Carlo মার্কভ মন্ট কার্লো নমুনা অ্যালগরিদমঃ মেট্রোপলিস-হ্যাস্টিং & গিবস) ।) ।
-
Clustering (ক্লাসিং):
- K মানে,
- কে-মিডিয়ড,
- দুই সেকেন্ডে কে মানে,
- FK-Means,
- ক্যানোপি,
- স্পেকট্রাল-কেমেন্স (Spectral-KMeans)
- GMM-EM (হাইব্রিড গাউস মডেল - প্রত্যাশিত সর্বাধিকীকরণ অ্যালগরিদম সমাধান)
- K-Pototypes, CLARANS (বিভক্তির ভিত্তিতে)
- BIRCH (স্তরের উপর ভিত্তি করে)
- CURE (স্তরের উপর ভিত্তি করে)
- DBSCAN (ঘনত্বের ভিত্তিতে)
- CLIQUE (ঘনত্ব ভিত্তিক এবং গ্রিড ভিত্তিক) ।
-
Classification & Regression (ক্লাসেশন ও রিগ্রেশন):
- লিনিয়ার রিগ্রেশন (LR)
- লজিস্টিক রেগ্রেশন লজিক্যাল রিগ্রেশন।
- SR (Softmax Regression সম্ভবত ক্লাস লজিক্যাল রিগ্রেশন)
- জিএলএম (Generalized Linear Model) একটি সাধারণ রৈখিক মডেল।
- RR ((রিজ রেগ্রেশন রিগ্রেশন / L2 নিয়মিত সর্বনিম্ন দ্বিগুণ রিগ্রেশন),
- LASSO ((Least Absolute Shrinkage and Selectionator Operator L1 নিয়ম সর্বনিম্ন দ্বিগুণ প্রত্যাবর্তন))
- আরএফ (এলোমেলো বন)
- DT (DecisionTree) - সিদ্ধান্তের গাছ
- GBDT (Gradient Boosting Decision Tree) হল একটি গ্র্যাডিয়েন্ট বুস্টিং ডিসিশন ট্রি।
- CART (ClassificationAnd Regression Tree) হল একটি শ্রেণীবিভাগ পুনর্বিবেচনা গাছ।
- কেএনএন (K-Nearest Neighbor)
- এসভিএম (সমর্থন ভেক্টর মেশিন),
- KF ((KernelFunction) Kernel ফাংশন PolynomialKernel Function বহুপলিয়াম Kernel ফাংশন,
- Guassian KernelFunction গ্যাসীয় কার্নেল ফাংশন/Radial BasisFunction RBF ব্যাসার্ধ ভিত্তিক ফাংশন,
- String KernelFunction স্ট্রিং কার্নেল ফাংশন)
- NB (Naive Bayes, Bayesian Network/Bayesian Belief Network/Belief Network), বিএন (Bayesian Network/Bayesian Belief Network/Belief Network), বিএন (Bayesian Network/Bayesian Belief Network/Belief Network), বিএন (Bayesian Network/Bayesian Belief Network/Belief Network), বিএন (Bayesian Network/Bayesian Belief Network/Belief Network), বিএন (Bayesian Network/Bayesian Belief Network/Belief Network) এবং বিএন (Bayesian Network/Bayesian Belief Network/Belief Network) ।
- এলডিএ (Linear Discriminant Analysis/FisherLinear Discriminant Analysis/ফিশার লিনিয়ার ডিসক্রিমিন্যান্ট বিশ্লেষণ)
- EL (Ensemble Learning ইন্টিগ্রেটেড লার্নিং বস্টিং, ব্যাগিং, স্ট্যাকিং)
- এডাপ্টিভ বুস্টিং (Adaptative Boosting) এর মাধ্যমে আপনি আপনার জীবনযাত্রা উন্নত করতে পারবেন।
- এমইএম (Maximum Entropy Model) ।
-
কার্যকারিতা মূল্যায়নঃ
- কনফিউশন ম্যাট্রিক্স
- প্রিসিশন (নির্ভুলতা), রিকল (রিকল রেট)
- Accuracy (নির্ভুলতা), F-score (F স্কোর),
- ROC কার্ভ (ROC কার্ভ), AUC (AUC এলাকা),
- লিফট কার্ভ, কেএস কার্ভ।
-
পিজিএম (Probabilistic Graphical Models Probability Chart Models):
- BN ((Bayesian Network/Bayesian Belief Network/BeliefNetwork) বেয়েজ নেটওয়ার্ক/বেয়েজ বিশ্বাস নেটওয়ার্ক/বিশ্বাস নেটওয়ার্ক)
- মার্কভ চেইন (Markov Chain) ।
- এইচএমএম (Hidden Markov Model) নামের এই মডেলটি একটি ম্যাক্সিকোভ মডেল।
- এমইএমএম (Maximum Entropy Markov Model) (সর্বোচ্চ এন্ট্রোপি মার্কভ মডেল)
- সিআরএফ (Conditional Random Field) নামক একটি বিমানবন্দর।
- MRF (মার্কভ র্যান্ডম ফিল্ড) ।
-
এনএন (Neural Network):
- ANN (আর্টিফিশিয়াল নিউরাল নেটওয়ার্ক)
- বিপি (Error BackPropagation) ।
-
ডিপলার্নিং
- অটো-এনকোডার (অটো এনকোডার)
- SAE (Stacked Auto-encoders) স্বয়ংক্রিয় এনকোডারগুলিকে একত্রিত করে।
- স্পারস অটো-ইনকোডারগুলি স্বয়ংক্রিয় এনকোডারগুলির একটি বিরল সংখ্যা।
- অটো-এনকোডারগুলিকে অটো-এনকোডারগুলির জন্য নীরব করে তোলা।
- কন্ট্রাক্টিভ অটো-ইনকোডার (CAC) ।
- RBM (Restricted Boltzmann Machine) নামক একটি যন্ত্র যা বোল্টজম্যানের একটি সীমিত মেশিন।
- ডাব্লুবিএন (Deep Belief Network) নামের এই নেটওয়ার্কটি একটি সামাজিক নেটওয়ার্ক।
- সিএনএন (Convolutional Neural Network) -এর একটি ভিডিওতে দেখা যাচ্ছে,
- Word2Vec (শব্দ ভেক্টর লার্নিং মডেল) ।
-
DimensionalityReduction (আকার হ্রাস):
- LDA Linear Discriminant Analysis/Fisher Linear Discriminant বিশ্লেষণ / ফিশার লিনিয়ার ডিসক্রিমিন্যান্ট বিশ্লেষণ
- পিসিএ (প্রধান উপাদান বিশ্লেষণ)
- আইসিএ (Independent Component Analysis) নামক একটি সংস্থা।
- SVD (একক মান বিভাজন)
- FA (ফ্যাক্টর বিশ্লেষণ) ।
-
টেক্সট মাইনিং (টেক্সট মাইনিং):
- ভিএসএম (ভেক্টর স্পেস মডেল)
- Word2Vec (ওয়ার্ড ভেক্টর লার্নিং মডেল)
- টিএফ (Term Frequency)
- TF-IDF ((Term Frequency-Inverse DocumentFrequency) শব্দ ফ্রিকোয়েন্সি-ইনভার্স ডকুমেন্ট ফ্রিকোয়েন্সি)
- মিউচুয়াল ইনফরমেশন (এমআই) ।
- ECE (Expected Cross Entropy) (প্রত্যাশিত ক্রস এন্ট্রোপি)
- QEMI (দ্বিতীয় তথ্য মনিটর)
- আইজি (InformationGain) তথ্য লাভ,
- আইজিআর (ইনফরমেশন গেইন রেসিও) তথ্য লাভের হার।
- গিনি (গিনি কোয়ালিটি)
- x2 Statistic ((x2 পরিসংখ্যান),
- TEW ((TextEvidence Weight) টেক্সট প্রমাণের অধিকার)
- OR (অডস রেসিও এডভান্টেজ)
- এন-গ্রাম মডেল,
- LSA (Latent Semantic Analysis) (ল্যাটেনট সিমান্টিক বিশ্লেষণ)
- PLSA (Probabilistic Latent Semantic Analysis) - সম্ভাব্যতার উপর ভিত্তি করে সম্ভাব্য অর্থ বিশ্লেষণ।
- এলডিএ (Latent Dirichlet Allocation) ।
-
অ্যাসোসিয়েশন মাইনিং (সম্পর্কিত খনন):
- আগে থেকেই,
- FP-growth (ফ্রিকোয়েন্সি প্যাটার্ন ট্রি গ্রোথ)
- প্রথমে,
- স্পাইড ।
-
সুপারিশ ইঞ্জিনঃ
- DBR (Demographic-based Recommendation) - জনসংখ্যার উপর ভিত্তি করে সুপারিশ
- CBR (Context-basedRecommendation) - বিষয়বস্তু ভিত্তিক সুপারিশ।
- সিএফ (Collaborative Filtering সহযোগী ফিল্টারিং)
- ইউসিএফ (ইউজার-ভিত্তিক সহযোগী ফিল্টারিং সুপারিশ)
- আইসিএফ (আইটেম-ভিত্তিক সহযোগী ফিল্টারিং সুপারিশ) ।
-
Similarity Measure&Distance Measure (সমতুল্যতা এবং দূরত্বের পরিমাপ):
- ইউক্লিডিয়ান দূরত্ব
- ম্যানহাটানের দূরত্ব
- Chebyshev Distance (চেবিশেভ দূরত্ব),
- মিনকোভস্কি দূরত্ব
- স্ট্যান্ডার্ডাইজড ইউক্লিডিয়ান দূরত্ব (Standardized Euclidean Distance)
- মহালানোবিস দূরত্ব (মার্টের দূরত্ব)
- কস (কসাইন কোষন)
- HammingDistance/Edit Distance (হ্যামিং দূরত্ব/সম্পাদনা দূরত্ব)
- জ্যাকার্ড ডিসট্যান্স (জ্যাকার্ড দূরত্ব)
- Correlation Coefficient Distance (প্রাসঙ্গিক সহগ দূরত্ব)
- তথ্য এন্ট্রোপি (ইনফরমেশন এন্ট্রোপি)
- KL ((Kullback-Leibler Divergence KL বিচ্ছিন্নতা/আপেক্ষিক এন্ট্রোপি আপেক্ষিকভাবে ঝাঁকুনি) ।)
-
Feature Selection (বৈশিষ্ট্য নির্বাচন অ্যালগরিদম):
- মিউচুয়াল ইনফরমেশন
- ডকুমেন্ট ফ্রিকোয়েন্সি
- তথ্য লাভ (Information Gain)
- এই পরীক্ষার ফলাফলের জন্য, আপনি একটি কার্ড পরীক্ষা করতে পারেন।
- গিনি (গিনি কোয়ালিফায়ার) ।
-
আউটলিয়ার ডিটেকশন (Outlier Detection):
- Statistic-based (গণনা ভিত্তিক)
- Distance-based (দূরত্ব ভিত্তিক)
- Density-based (ঘনত্ব-ভিত্তিক)
- Clustering-based (ক্লাস ভিত্তিক) ।
-
Learning to Rank (শিক্ষার ভিত্তিতে র্যাঙ্কিং):
- পয়েন্টওয়াইডঃ ম্যাক্র্যাঙ্ক;
- প্যারেজ অনুযায়ীঃ র্যাঙ্কিংএসভিএম, র্যাঙ্কনেট, ফ্রাঙ্ক, র্যাঙ্কবুস্ট;
- তালিকা অনুযায়ী: অ্যাডা র্যাঙ্ক, সফট র্যাঙ্ক, ল্যামডামার্ট ।
আরো