En el mundo de la educación y la tecnología, la innovación es clave. Por eso creamos un Chat Bot Inteligente para Entidades Educativas. Eso es precisamente lo que Ignacio Urteaga, junto con Cristian Salgueiro y Simón Lozada, han logrado en los últimos dos meses: desarrollar un Bot inteligente para responder las preguntas de los participantes de sus cursos. Pero, ¿cómo lo hicieron? ¿Qué desafíos enfrentaron? En esta charla, Ignacio nos lleva detrás de cámaras de esta fascinante aventura.
El desafío: Un Bot que responda preguntas académicas
La idea parecía simple: crear un Bot que pudiera resolver dudas comunes de los estudiantes, como horarios, acceso a grabaciones o detalles sobre los cursos. Sin embargo, lo que comenzó como un proyecto aparentemente sencillo, se convirtió en un desafío técnico y creativo.
Ignacio explica que, tradicionalmente, los Bots se construían con respuestas predefinidas para preguntas específicas. Esto garantizaba precisión, pero limitaba su flexibilidad. Con el avance de los grandes modelos de lenguaje (LLM, por sus siglas en inglés), como ChatGPT, los Bots se volvieron más versátiles, capaces de interpretar una amplia gama de preguntas. Pero aquí surgió un nuevo problema: ¿cómo asegurarse de que el Bot responda exactamente lo que queremos, especialmente cuando se trata de contenidos específicos o controvertidos?
Un enfoque híbrido: Lo mejor de ambos mundos
La solución que encontraron fue un enfoque híbrido. Por un lado, el Bot utiliza respuestas predefinidas para preguntas comunes, como «¿Dónde está el Moodle?» o «¿Cuáles son los horarios del curso?». Esto garantiza respuestas rápidas y precisas, sin necesidad de recurrir a un modelo de lenguaje complejo.
Por otro lado, para preguntas más complejas o específicas, el Bot recurre a un LLM, como ChatGPT, pero con un giro: está entrenado con documentos propios. Esto se conoce como RAG (Retrieval-Augmented Generation), una técnica que permite al Bot priorizar información específica y responder desde un contexto controlado.
Cómo funciona el entrenamiento específico
El proceso de entrenamiento es fascinante. Los documentos se dividen en «chunks» (fragmentos), que son analizados y convertidos en vectores en un espacio multidimensional. Cuando un usuario hace una pregunta, el Bot busca los «chunks» más cercanos a esa pregunta y los utiliza para generar una respuesta precisa y contextualizada.
Además, el equipo implementó un «modo seguro», que permite al Bot negarse a responder si la pregunta está fuera de su ámbito de entrenamiento. Esto es especialmente útil para evitar respuestas no deseadas o incorrectas.
Ventajas del enfoque híbrido
Este enfoque híbrido ofrece varias ventajas:
- Rapidez y precisión: Para preguntas comunes, el Bot responde al instante, sin necesidad de recurrir a un modelo complejo.
- Flexibilidad: Para preguntas más complejas, el Bot utiliza un LLM, pero con la capacidad de priorizar información específica.
- Trazabilidad: El Bot guarda un registro de las preguntas y respuestas, lo que permite mejorar continuamente su desempeño.
- Personalización: El Bot puede configurarse en modo abierto o cerrado, dependiendo de las necesidades del cliente.
Más allá de las respuestas: Funcionalidades adicionales
El Bot no solo responde preguntas. También puede devolver archivos, como programas de cursos en formato PDF, y formatear respuestas usando código HTML para que sean más legibles y atractivas. Además, el equipo ha implementado un sistema que permite reutilizar respuestas anteriores, lo que reduce el costo y mejora la eficiencia.
Un proyecto en constante evolución
Lo más emocionante de este proyecto es que no tiene un final. El Bot sigue aprendiendo y mejorando, gracias a la retroalimentación constante y a la incorporación de nuevos documentos y funcionalidades.
Si te interesa saber más sobre cómo este Bot puede transformar la experiencia educativa, o si quieres implementar algo similar en tu organización, no dudes en contactar al equipo. ¡La aventura recién comienza!
Si te interesa conocer más sobre cómo la ciencia de datos puede transformar el mundo, no te pierdas esta charla. Y si quieres seguir explorando este tema, ¡suscríbete a nuestro Canal de YouTube para no perderte las próximas publicaciones!
¿Quieres aprender Ciencia de Datos a distancia con clases en vivo todas las semanas? Más información en www.institutodatascience.org