jueves, 5 de noviembre de 2009

Data Mining

El Data Mining (mineria de datos) busca encontrar información no trivial que se encuentra de manera implícita en los datos. Dicho de otra manera el data mining prepara, sondea y explora los datos para encontrar información oculta en ellos.

Las bases para el data mining son la inteligencia artificial y la estadística. A continuación las técnicas mas utilizadas para DM.

• Redes neuronales: se basa en el aprendizaje y procesamiento automático, trata de simular el sistema nervioso.

• Regresión Lineal: es una técnica estadística que busca relaciones de datos. Es rápida y eficaz pero cuando se desea trabajar en modelos con mas de 2 dimensiones resulta ineficiente.

• Modelos estadísticos: es una ecuación que se emplea en diseños experimentales y en la regresión para indicar los diferentes factores que modifican la variable de respuesta.

• Clustering: en esta técnica se agrupan una serie de vectores según criterios de distancia y se trata de disponer los vectores de entrada de forma que estén mas cercanos los que tienen características comunes.

• Árboles de Decisión: este es un modelo de predicción utilizado en el ámbito de la IA. Sirven para encontrar una solución en un problema con una serie de condiciones que se dan en forma sucesiva.

El data mining se puede utilizar para encontrar patrones en las ventas, encontrar la razón por la cual los clientes deserten de seguir comprando en una compañía, haciendo predicciones de clientes y también para hacer proyecciones para el futuro basadas en datos históricos en los Data Warehouse.



No hay comentarios:

Publicar un comentario