¿Quiénes deberían estudiar Ciencia de Datos, quienes tienen posibilidades? ¿En qué consiste? ¿Cómo estudiar Ciencia de Datos? Primero vamos a repasar qué es Ciencia de Datos.
¿Qué es Ciencia de Datos?
La ciencia de datos como su nombre lo indica tiene que ver con aplicar el método científico. ¿A qué se lo vamos a aplicar? A datos. A datos que la organización ya tiene o que puede conseguir. ¿Para qué? Para poder entender el pasado, para ver si con los datos podemos explicar lo que ha ocurrido. Pero la parte brava es la parte de predecir el futuro. Porque la plata que tenemos por ganar, o la eficiencia que deseamos obtener están en el futuro. A partir de esas predicciones vamos a poder aportarle al difícil arte de tomar decisiones.
El método científico de la Ciencia de Datos
El método científico de la Ciencia de Datos se basa en datos. Datos preexistentes. Observando esos datos, entendiendo el negocio, mirando los antecedentes hacemos hipótesis. Hipótesis sobre como se comportan las cosas. Esas hipótesis podrán estar bien o mal, pero una hipótesis que no podamos hacer un experimento que la pueda refutar esta fuera de la ciencia de datos.
La hipótesis debe ser concreta como para que no haya dudas de si anduvo o no anduvo. Un experimento que deja dudas acerca de si prueba o refuta la hipótesis es un experimento que no sirve.
Un experimento es cuando tratamos de atar todas las variables que no queremos que se muevan para dejar en movimiento solo las variables sobre las que se formula la hipótesis. Una vez que hacemos el experimento debemos tener una respuesta clara, funciono o no funciono. Si funciono eureka, si no funciono entonces si el experimento es valido obtuvimos nuevos datos preexistentes que nos van a ayudar a generar mejores hipótesis.
¿Con que datos se trabaja?
Un Científico de Datos trabaja con los datos acumulados en los sistemas transicionales de cada organización. Las ventas, las compas, las quejas, las operaciones, hay de todo. A eso se le suma los datos de los experimentos anteriores, tanto los que anduvieron bien como los que no. Podemos obtener datos de fuentes publicas, como por ejemplo censos. Seguramente se necesite un proceso de curación de datos antes de trabajar con ellos. Podemos obtener datos de nuestros proveedores o de nuestros clientes.
¿Para qué sirve Data Science?
Para entender el pasado y predecir el futuro. Predecir el futuro puede significar muchas cosas, para empezar:
- Podemos reducir los costos.
- Mitigar riesgos.
- Aumentar beneficios.
- Mejorar la eficiencia.
¿Quieres aprender más sobre Ciencia de Datos?
Te recomendamos ingresar a nuestra diplomatura en Ciencia de Datos con R y Python. Tiene una duración de 25 semanas y se dictan 3 clases en vivo por semana. Mensualmente estamos lanzando nuevos grupos de alumnos. Puedes acceder a más información en https://institutodatascience.org/diplomatura-en-ciencia-de-datos-con-r-y-python/