CRISP-DM

Nos proponemos reflexionar sobre la propuesta metodológica de CRISP-DM (CRoss Industry Standard Process Data Mining). Vamos a explicar como esta compuesta esta recomendación metodológica CRISP-DM, y de donde salió. También vamos a señalar sus beneficios y vamos a hablar un poquitito de lo que podría no salir tan bien.

¿Cuáles son las ventajas de CRISP-DM y cómo puedo realizarlo?

CRISP-DM propone un proceso estándar de minería de datos para cualquier industria.

¿Por qué se creo esta metodología de trabajo?

Buscan que los éxitos que tienen los autores sean repetibles. Porque se encuentran que esos éxitos son bastantes dependientes de los operadores, de quienes hacen las cosas. Gente con experiencia en general le sale las cosas bien y gente sin experiencia en general suele cometer errores. Entonces tratan de ayudar al menos experto con una guía metodológica.

Lo que propone esta metodología es traducir necesidades del negocio en cosas que el científico de datos pueda responder. Y después ayudar a cruzar las fronteras de las industria. Por ejemplo si uno es experto en Data Mining en la industria de los seguros, hay que ver como le iría en una industria donde se fabrican cosas.

Cuando se propone esta metodología, la minería de datos estaba pasando por el punto de la curva que llaman el abismo de la desesperación, eso es un problema y trataron de hacer un aporte que contribuyera que llegara al plato de rendimiento.

¿Cómo es CRISP-DM?

Señala cuatro niveles de abstracción en los que podemos pensar:

  • grandes fases
  • tareas genéricas
  • tareas especializadas
  • instancias de procesos

La Metodología CRISP-DM se presenta en dos niveles:

  • Un modelo de referencia abstracto donde va a contar lo que pretende con cada fase, con cada tarea.
  • Una guía del usuario que va a contener sugerencias mas detalladas para cada caso.

¿Desea saber más sobre la metodología CRISP-DM?

Visita nuestro Canal de YouTube del Instituto Data Science Argentina para más contenido exclusivo sobre Data Science.