Statistics and Machine Learning Toolbox™ proporciona funciones y apps para describir, analizar y modelar datos. Puede utilizar estadística descriptiva, visualizaciones y agrupación para el análisis exploratorio de datos, ajustar distribuciones de probabilidad a datos, generar números aleatorios para simulaciones Montecarlo y realizar comprobaciones de hipótesis. Los algoritmos de regresión y clasificación permiten extraer inferencias de los datos y crear modelos predictivos de forma interactiva (utilizando las apps Classification Learner y Regression Learner) o de forma programática (utilizando AutoML).
Para el análisis de datos multidimensionales y la extracción de características, la toolbox proporciona métodos de análisis de componentes principales (PCA), regularización, reducción de dimensionalidad y selección de características que permiten identificar variables con la máxima capacidad predictiva.
Esta toolbox proporciona algoritmos de machine learning supervisado, semisupervisado y no supervisado, incluidos máquinas de vector soporte (SVM), árboles de decisión boosted, K-means y otros métodos de agrupación. Puede aplicar técnicas de interpretabilidad tales como gráficas de dependencia parcial y LIME, así como generar automáticamente código C/C++ para el despliegue embebido. Muchos algoritmos de esta toolbox se pueden emplear con conjuntos de datos que son demasiado grandes para almacenarlos en la memoria.