De los datos a la información


Los datos han de ser tratados de forma sistemática, con objeto de extraer información relevante, significativa y fiable. Para ello se utilizan potentes técnicas y herramientas que saquen a la luz las posible pautas subyacentes

Técnicas empleadas

  • Exploratory Data Analysis (EDA)
  • Link Analysis: asociaciones
  • Clasificaciones
  • Modelos de regresión
  • Identificación de casos atípicos
  • Clustering: agrupación de la población en función de una familia de rasgos o variables
  • Árboles de decisión
  • Modelos probabilísticos (probabilidad condicional bayesiana)
  • Modelos predictivos

Principales herramientas

  • Data Warehouse
  • Software de análisis estadístico: R, etc.
  • Software de Data Mining: R, Hadoop, RapidMiner, WEKA...
  • …e invertir en inteligencia humana