Es un proceso con el cual se obtiene información de conjuntos de datos enormes, así como patrones.
Las técnicas de minería pueden ser categorizadas en dos partes:
- Describir el conjunto de datos de destino
- Prever resultados mediante machine learning
El proceso para obtener estos datos se resumen en:
Establecer objetivos: Es necesario que se tenga un dominio del tema para el cual se va a llevar a cabo la minería de datos para así poder formular las preguntas correspondientes para determinado proyecto.
Preparación de datos: Una vez definido el problema y se haya recopilado la información, hay que hacer una limpieza de los datos, eliminando duplicidades, valores perdidos, atípicos y cualquier tipo de ruido que estos puedan tener.
Aplicación de algoritmos: Dependiendo de las necesidades, se aplicará algún algoritmo que resulte útil para el análisis de la información.
Evaluación de resultados: Una vez obtenidos los resultados es solo cuestión de evaluarlos e interpretarlos para así aplicar estos conocimientos e implementar alguna nueva estrategia o aplicarlo al proyecto según se requiera.
Sin comentarios