🔴 APRENDE EN VIVO Y A TU RITMO, VISITANOS EN WWW.INSTITUTODATASCIENCE.ORG

Tu primer proyecto en Data Science

¿Cómo crear tu primer proyecto en data science?

¿Qué son los proyectos?¿Cómo realizar tu primer proyecto en el mundo de la ciencia de datos? Proponemos algunas buenas practicas que nos puedan ayudar a hacer tu primer proyecto en data science. Algunas de estas ideas van a ser aplicables a proyectos posteriores.

Los proyectos son esfuerzos que van a durar un tiempo definido. La idea del proyecto es que sea encajado en el tiempo. Tiene que ser un resultado novedoso, no es para realizar lo que ya se hizo. Hay proyectos de cualquier tamaño.

¿Por qué hacemos proyectos?

La mayoría de las organizaciones ganan dinero ejecutando operaciones continuas. Acciones que se repiten persiguiendo resultados conocidos. Como se observa, los proyectos al mismo tamaño son muchos mas arduos de gestionar que las operaciones continuas. Buscar lo desconocido es más difícil que obtener lo desconocido.

Uno realiza proyectos porque quiere desarrollar ventajas competitivas para producir algo que la competencia no puede producir o producirlo más barato, para dar un salto o necesidad de actualizar las operaciones para reducir el costo, o reducir la exposición a algún riesgo.

¿Qué dificultades nos encontramos en general con los proyectos de ciencia de datos?

  • Los objetivos pueden ser inciertos. Por ejemplo nuestro cliente nos indica que quiere vender más, pero cómo, de qué.
  • Los datos no suelen ser limpios. Nuestra materia prima, nuestro moderno petróleo suele venir contaminado.
  • Las expectativas suelen ser muy altas. Se esperan soluciones mágicas y la magia no existe.
  • Los errores son muy fáciles de cometer pero difíciles de encontrar.

Dificultades en tu primer proyecto de data science

Cuando hacemos nuestro primer proyecto de ciencia de datos estamos mas comprometidos que mas adelante. La organización no tiene idea de que puede esperar, que va a salir de ahí. También que al ser nuestro primer proyecto dudamos, hay que jugarse y hay que hacerlo. Debemos asegurarnos que va a pasar con el tiempo y el capital necesarios para encarar ese proyecto. Nos va a costar vencer la incredulidad y vender los resultados.

Buenas practicas para los proyectos en ciencia de datos en general

  • Pequeños hitos con visibilidad.
  • Hitos intermedios que agreguen valor.
  • Evitar las grandes inversiones y los plazos muy largos mientras no se tenga un condigno nivel de madurez.
  • redefinir el fracaso: si hay aprendizaje no hay fracaso.

10 sugerencias para tu proyecto de data science

  1. Que sea un tema que importe a los sujetos que dirigen la organización, de ser posible que sea un tema que les saque el sueño
  2. Traten de manejarse con herramientas, que bien sean libres, o bien estén disponibles en la organización
  3. No empezar por el almacén de datos, da un montón de trabajo de limpieza y de información que es difícil venderlo como un avance
  4. No caer en la tentación de tomar los datos del transaccional para hacer mis análisis, los saco los trabajo separados, limpios, sin molestar a nadie, y los guardo después empaquetados con la solución para que pueda ser repetible.
  5. Comentar las soluciones que refuerzan el sentido común dando seguridad del trabajo que se ha realizado.
  6. Verificar doblemente los hallazgos . Reproducirlos con varios modelos basados en diferentes algoritmos.
  7. Probar con varios conjuntos de entrenamiento y prueba para asegurarse en que medida impacta esa selección.
  8. Antes de anunciar el resultado hacer un ensayo para reforzar como vamos a exponerlos.
  9. Apoyarse en gráficos claros. cada gráfico muestra una idea.
  10. reflexionar sobre las objeciones y los intereses de los contrariados por las conclusiones alcanzadas.

La manera más simple para aquel que tiene un trabajo que no es en ciencia de datos a moverse laboralmente hacia la ciencia de datos es realizar para su empleador actual algún pequeño aporte con lo que ya sabe de data science aprovechando que tiene conocimiento del negocio y de los datos disponibles. Sin embargo este primer acto de la transformación es necesario que salga bien, sino va a ser difícil obtener un segundo intento.