📣 Big news: LightlyStudio is now live! Try it for free.

A-Z of Machine Learning and Computer Vision Terms

Artificial Intelligence (AI)

Binary Classification

Canonical Correlation Analysis (CCA)

Case-Based Reasoning

Chain of Thought (CoT)

ChatGPT

Chi-Squared Automatic Interaction Detection (CHAID)

Class Boundary (Statistics & Machine Learning)

Class Imbalance

Clustering

Collaborative Filtering

Computer Vision

Computer Vision Model

Concept Drift

Conditional Random Field (CRF)

Confusion Matrix

Constrained Clustering

Contrastive Learning

Convolutional Neural Network (CNN)

Deep Reinforcement Learning (DRL)

Dimensionality Reduction

Dropout

Dynamic and Event-Based Classifications

Expectation-Maximization Algorithm (EM)

Extreme Learning Machine

Fisher’s Linear Discriminant

Foundation Models

Frame Rate

Frames Per Second (FPS)

Fully Connected Layer

Fuzzy Logic

Generative Adversarial Network (GAN)

Generative Adversarial Networks

Data Pre-processing

Data pre-processing involves transforming raw data into a clean and structured format suitable for modeling. Real-world data is often incomplete, noisy, and inconsistent, so pre-processing includes tasks like data cleaning (handling missing values, smoothing noise, correcting errors), data integration (merging data from multiple sources), data transformation (normalization, encoding categorical variables, feature extraction), and data reduction (dimensionality reduction, sampling). For example, converting “yes/no” categories to 1/0, scaling features to [0,1] range, or extracting day of week from a timestamp are pre-processing steps. Effective pre-processing improves model performance and training speed, as many algorithms assume a certain well-behaved input format. It is a critical early phase in any data mining or machine learning project.