RAG Engineering: Construye IA que Conoce tus Datos
Un curso completo de 12 lecciones sobre Retrieval-Augmented Generation — desde embeddings y bases de datos vectoriales hasta pipelines de produccion y evaluacion. Construye sistemas de IA que responden preguntas usando tus propios datos.
Los grandes modelos de lenguaje son extraordinariamente capaces, pero comparten una limitacion comun: solo conocen lo que estaba en sus datos de entrenamiento. No pueden acceder a los documentos internos de tu empresa, las especificaciones mas recientes de tu producto ni los tickets de soporte de ayer. Retrieval-Augmented Generation (RAG) resuelve esto conectando los LLMs a fuentes de conocimiento externas en tiempo de inferencia, permitiendoles responder preguntas basadas en tus datos reales. Este curso te ensena a disenar, construir y desplegar sistemas RAG de nivel produccion desde cero.
Modulo I — Fundamentos (Lecciones 1-3): Comprende por que RAG es importante, como las limitaciones de los LLMs crean la necesidad de recuperacion de conocimiento externo y las tecnologias centrales que lo hacen posible. Aprenderas como los embeddings codifican significado en vectores, exploraras el panorama de las bases de datos vectoriales y entenderas las ventajas y desventajas entre servicios gestionados y soluciones autoalojadas.
Modulo II — Pipeline de Datos (Lecciones 4-6): Domina el arte de preparar datos para la recuperacion. Procesaras documentos de diversos formatos, implementaras estrategias de chunking que equilibran precision y contexto, y aplicaras tecnicas avanzadas de recuperacion que incluyen busqueda hibrida, re-ranking y filtrado por metadatos para llevar la informacion correcta al modelo.
Modulo III — Construccion y Avance (Lecciones 7-9): Ensambla pipelines RAG completos usando LangChain y LlamaIndex, luego ve mas alla del basico recuperar-y-generar con patrones avanzados como RAG multi-consulta, HyDE, RAG agentico y sistemas de recuperacion especificos para codigo que entienden lenguajes de programacion a nivel estructural.
Modulo IV — Produccion y Practica (Lecciones 10-12): Evalua tu sistema RAG con metricas rigurosas usando RAGAS y tecnicas de LLM-como-juez, luego endurecelo para produccion con cache, monitoreo, seguridad y optimizacion de costos. El curso culmina en un proyecto final practico donde construyes un sistema de base de conocimiento completo de principio a fin.
Ya seas un ingeniero de ML anadiendo recuperacion a tus aplicaciones LLM, un desarrollador backend construyendo busqueda potenciada por IA, o un fundador tecnico prototipando un producto de conocimiento, este curso te da las habilidades practicas para enviar sistemas RAG que funcionan de manera confiable en el mundo real.
Lecciones
Por que RAG es Importante
7 min read
Embeddings a Fondo
8 min read
Bases de Datos Vectoriales
8 min read
Procesamiento de Documentos
7 min read
Estrategias de Chunking
7 min read
Tecnicas de Recuperacion
7 min read
Construyendo un Pipeline RAG
7 min read
Patrones Avanzados de RAG
8 min read
RAG para Codigo
8 min read
Metricas de Evaluacion
9 min read
RAG en Produccion
8 min read
Proyecto: Construye una Base de Conocimiento
10 min read