Cómo Funciona Insight AI

01 · Visión General

3 Preguntas que Responde Insight AI

Insight AI procesa los datos de capacitación de su organización
para responder 3 preguntas estratégicas con evidencia cuantificable:

📊

¿Sirvió la capacitación?

Compara empleados capacitados vs no capacitados para medir las horas ahorradas y el dinero no perdido gracias a la formación.

Impacto Medido

⚠️

¿Qué pasa si NO capacitamos?

Predice cuánto dinero se pierde por área, equipo y persona si no se invierte en formación. Cuantifica el costo de la inacción.

Predicción de Riesgo

💡

¿A quién capacitamos primero?

Genera una lista priorizada de candidatos con el retorno de inversión estimado por cada persona. Optimiza cada peso invertido.

Recomendación con ROI

02 · Proceso

De los Datos al Resultado en 6 Etapas

Desde la carga del archivo hasta el reporte final, todo se ejecuta de forma automática y sin intervención manual.

📥1

Carga de Datos

Se carga el archivo Excel con los indicadores de desempeño antes y después de la capacitación, junto con la información de participantes.

📊2

Medición de Impacto

Compara la evolución de los empleados capacitados contra los no capacitados a nivel de cohorte, equipo y área para medir el impacto real.

🤖3

Entrenamiento de IA

Tres modelos de inteligencia artificial se combinan para predecir el riesgo futuro de cada empleado y cuánto retrabajo generará si no recibe capacitación.

💡4

Recomendación Inteligente

La IA calcula el retorno de inversión esperado por cada candidato y selecciona automáticamente los que maximizan el beneficio dentro del presupuesto disponible.

📗5

Generación de Reportes

Se genera un Excel con 20 hojas de detalle, un reporte ejecutivo de texto, y 7 gráficos profesionales de validación del modelo.

🖥️6

Dashboard Interactivo

Los resultados se exportan automáticamente al panel web donde clientes e inversores pueden explorar el impacto, riesgo y recomendaciones con gráficos dinámicos.

02.5 · Diagramas Obligatorios

Diagramas Tecnicos del PDF

Se renderizan con Mermaid para replicar el estilo del documento tecnico y mantener legibilidad en desktop y mobile.

Flujo del Pipeline (8 pasos)

Vista end-to-end del pipeline: entrada, analisis, exportacion y reporte final.

flowchart TD
    A["Excel de Entrada\n(ModeloDatos_v3.xlsx)"] --> B["PASO 1\nbuild_impacto_individual"]
    B --> C["PASO 2\nDiD Analysis\n(3 niveles)"]
    B --> D["PASO 3\nStacking ML Training"]
    D --> E["PASO 3b\nRisk Tables"]
    D --> V["VISUALIZACIONES\n(7 graficos PNG)"]
    B --> F["PASO 4\nUplift + Prescripcion"]
    C --> G["PASO 5\nOne-Pager Ejecutivo"]
    E --> G
    F --> G
    G --> H["PASO 6\nExcel Consolidado\n(InsightAI_FINAL.xlsx)"]
    H --> I["PASO 7\nJSON Dashboard\n(9 archivos)"]
    I --> J["PASO 8\nReporte + Reglas\n(REPORTE_INSIGHT_AI.txt)"]

    style A fill:#3498db,color:#fff,stroke:#1f5a94
    style D fill:#e74c3c,color:#fff,stroke:#b53528
    style V fill:#9b59b6,color:#fff,stroke:#6f3d85
    style H fill:#2ecc71,color:#fff,stroke:#238a4f
    style J fill:#f39c12,color:#fff,stroke:#b8740e

    click A "javascript:void(0);" "Punto de inicio: Excel cargado con la información del personal."
    click B "javascript:void(0);" "PASO 1: Procesamiento inicial y limpieza de datos."
    click C "javascript:void(0);" "PASO 2: Análisis DiD. Compara capacitados con grupo de control."
    click D "javascript:void(0);" "PASO 3: Entrenamiento de Inteligencia Artificial."
    click E "javascript:void(0);" "PASO 3b: Tablas de Riesgo por ineficiencias."
    click V "javascript:void(0);" "Generación de 7 gráficos estáticos profesionales."
    click F "javascript:void(0);" "PASO 4: Modelo de Uplift y Prescripción óptima."
    click G "javascript:void(0);" "PASO 5: One-Pager Ejecutivo con reporte resumen."
    click H "javascript:void(0);" "PASO 6: Generación y guardado del Excel Consolidado Final."
    click I "javascript:void(0);" "PASO 7: Archivos JSON para pintar el Dashboard web."
    click J "javascript:void(0);" "PASO 8: Reporte en texto plano de reglas y auditoría AI."

Guía de Lectura Rapida

DiD Analysis: (Diferencias en Diferencias) Metodo estadístico para aislar el impacto real de la capacitación frente a factores externos.
Stacking ML: Motor predictivo compuesto por múltiples inteligencias artificiales trabajando en equipo.
Uplift + Prescripcion: Recomendacion automatica de a quién capacitar para maximizar el Retorno de Inversión (ROI).
One-Pager: Resumen ejecutivo final de una pagina diseñado para la toma de decisiones gerenciales.

Componentes Detallados

Mapa simplificado de los bloques funcionales principales del motor.

flowchart LR
    X["Entrada de Datos\nExcel + Participantes + KPIs"] --> I["Impacto Real\nDifference-in-Differences"]
    X --> M["Motor ML\nStackingRegressor"]
    M --> R["Tablas de Riesgo\npersona/equipo/area"]
    M --> U["Uplift y Prescripcion\nROI por candidato"]
    I --> E["One-Pager Ejecutivo"]
    R --> E
    U --> E
    E --> O["Salidas\nExcel + JSON + Reporte + Graficos"]

    style X fill:#e8f1ff,stroke:#6a95d1,color:#123c67
    style M fill:#ffeceb,stroke:#de7f73,color:#7c281f
    style O fill:#eafaf0,stroke:#7ac597,color:#1d5c3a

    click X "javascript:void(0);" "Fuente de datos inicial: archivos y parámetros de rendimiento."
    click I "javascript:void(0);" "PASO 7: Archivos JSON para pintar el Dashboard web."
    click M "javascript:void(0);" "Motor StackingRegressor que combina varios algoritmos de IA."
    click R "javascript:void(0);" "Cálculo del riesgo de ineficiencia por área o equipo."
    click U "javascript:void(0);" "Lista prescrita optimizando el Retorno de Inversión (ROI)."
    click E "javascript:void(0);" "PASO 3b: Tablas de Riesgo por ineficiencias."
    click O "javascript:void(0);" "Archivos resultantes tras la ejecución del motor."

Conceptos Clave

Difference-in-Differences: Tecnica que actua como "grupo de control medico" para medir que porcentaje de mejora se debe a la capacitación y que porcentaje a tendencias del mercado.
StackingRegressor: Algoritmo de IA. Imagínelo como una "junta médica" de varios expertos que votan para asegurar predicciones sin sesgos ni errores simples.
KPIs: (Key Performance Indicators) Las métricas de desempeño o productividad que la empresa busca mejorar (ej: ventas, llamadas, tiempos).

Difference-in-Differences — DiD (lineas 436-536)

Comparacion causal entre tratados y control a nivel cohorte, equipo y area.

flowchart TD
    IND["impacto_individual"] --> D1["did_table(..., group_cols=['cohort'])\n-> did_cohort_raw"]
    IND --> D2["did_table(..., group_cols=['area','team'])\n-> did_team_raw + filtrado"]
    IND --> D3["did_table(..., group_cols=['area'])\n-> did_area_raw + filtrado"]

    style IND fill:#ecf4ff,stroke:#7a9ece,color:#173f70
    style D1 fill:#f5f8ff,stroke:#b6cae6,color:#1e4d7d
    style D2 fill:#f5f8ff,stroke:#b6cae6,color:#1e4d7d
    style D3 fill:#f5f8ff,stroke:#b6cae6,color:#1e4d7d

    click IND "javascript:void(0);" "Efecto causal (impacto) sobre un trabajador en específico."
    click D1 "javascript:void(0);" "Efecto extrapolado a todo el rango etario o generación."
    click D2 "javascript:void(0);" "Efecto aglomerado en la célula o subequipo directo."
    click D3 "javascript:void(0);" "Efecto sumado para justificar inversiones en toda el área/gerencia."

did_effect = (post_treated - pre_treated) - (post_control - pre_control) money_not_lost = did_effect * n_treated * hourly_cost

¿Que significa este cálculo?

El efecto neto (did_effect): Compara el "antes y despues" de los que se capacitaron contra los que NO lo hicieron (“grupo de control”). Si todos mejoraron por estacionalidad, el sistema no le da credito regalado a la capacitacion.
Niveles de agrupacion (cohort/team/area): Permite saber si la capacitacion funcionó mejor para la generacion 2023, para un equipo especifico o globalmente para la sucursal.
Dinero Recuperado: Convierte esa diferencia porcentual directamente en horas y dinero segun los costos reales por hora trabajada.

Pipeline de Entrenamiento Completo

Secuencia de entrenamiento, validacion y persistencia del modelo de regresion.

flowchart LR
    A["Datos crudos"] --> B["GroupShuffleSplit\n(75/25 por persona)"]
    B --> C["Train Set"]
    B --> D["Test Set"]
    C --> E["Data Augmentation\n(ruido 1%)"]
    E --> F["ColumnTransformer\n(impute + one-hot)"]
    F --> G["StackingRegressor"]
    G --> H["Predicciones"]
    H --> I["Bootstrap CI"]
    H --> J["RMSE + R2"]
    G -->|"joblib.dump"| K["model.joblib"]

    style G fill:#ffe9e6,stroke:#dc7d72,color:#7b261f
    style I fill:#eef8ff,stroke:#8fb2df,color:#1d4d7d
    style J fill:#eef8ff,stroke:#8fb2df,color:#1d4d7d
    style K fill:#ecf8ef,stroke:#7fbd95,color:#20583c

    click A "javascript:void(0);" "Punto de inicio: Excel cargado con la información del personal."
    click B "javascript:void(0);" "PASO 1: Procesamiento inicial y limpieza de datos."
    click C "javascript:void(0);" "PASO 2: Análisis DiD. Compara capacitados con grupo de control."
    click D "javascript:void(0);" "PASO 3: Entrenamiento de Inteligencia Artificial."
    click E "javascript:void(0);" "PASO 3b: Tablas de Riesgo por ineficiencias."
    click F "javascript:void(0);" "PASO 4: Modelo de Uplift y Prescripción óptima."
    click G "javascript:void(0);" "PASO 5: One-Pager Ejecutivo con reporte resumen."
    click H "javascript:void(0);" "PASO 6: Generación y guardado del Excel Consolidado Final."
    click I "javascript:void(0);" "PASO 7: Archivos JSON para pintar el Dashboard web."
    click J "javascript:void(0);" "PASO 8: Reporte en texto plano de reglas y auditoría AI."
    click K "javascript:void(0);" "Archivo físico que guarda la 'memoria' del modelo para el futuro."

Conceptos Clave de Entrenamiento

GroupShuffleSplit (75/25): El sistema estudia el 75% de los casos pasados y se le hace un "examen sorpresa" con el 25% restante para medir su verdadera precision empírica.
Data Augmentation: Agregamos un 1% de "ruido" a los datos para entrenar a una IA más robusta que sepa lidiar con la incertidumbre del mundo real.
Bootstrap CI: (Intervalos de Confianza) En lugar de prometer un numero absoluto, la IA entrega rangos realistas ("estoy segura al 95% de que el ahorro sera entre X e Y").

Uplift y Prescripción (lineas 793-918)

Dos modelos estiman ahorro esperado para construir un ranking ROI con restricciones reales.

flowchart TD
    subgraph MODELO_T["Stacking: Modelo Tratados"]
        MT["Entrena con datos\nde personas capacitadas"]
    end
    subgraph MODELO_C["Stacking: Modelo Control"]
        MC["Entrena con datos\nde personas NO capacitadas"]
    end

    ALL["Todos los\ncandidatos"] --> MT
    ALL --> MC
    MT -->|"y_treated"| UPLIFT
    MC -->|"y_control"| UPLIFT
    UPLIFT["uplift = y_control - y_treated\n(horas ahorradas si capacitas)"]
    UPLIFT --> MONEY["money_not_lost = uplift x hourly_cost"]
    MONEY --> ROI["ROI = money_not_lost - cost_per_seat"]
    ROI --> RANK["Ranking por ROI\n(dedup por persona)"]
    RANK --> SELECT["Seleccion con restricciones:\n- seats disponibles\n- budget maximo"]

    style UPLIFT fill:#f2eaff,stroke:#9b78cb,color:#43236c
    style ROI fill:#ecf7ff,stroke:#90b6de,color:#1e4f7f
    style SELECT fill:#e8f8ee,stroke:#7bbf95,color:#215a3d

    click MT "javascript:void(0);" "Ficción estadística: Qué pasaría si se hace el curso."
    click MC "javascript:void(0);" "Ficción estadística: Qué pasaría si NO se hace el curso."
    click ALL "javascript:void(0);" "Población total elegible para tomar el curso."
    click UPLIFT "javascript:void(0);" "Diferencia de productividad neta lograble por el curso."
    click MONEY "javascript:void(0);" "Ahorro financiero transformando tiempo en dinero base sueldo."
    click ROI "javascript:void(0);" "Ahorro total menos el costo de la plataforma Insight AI."
    click RANK "javascript:void(0);" "Orden meritocrático descendente según la rentabilidad."
    click SELECT "javascript:void(0);" "La lista VIP priorizada hasta que se agote el presupuesto."

¿Que miden estos pasos?

Uplift (mejora neta): Identifica a las personas que realmente haran un cambio radical solo si toman el curso. Evita gastar cupos en personas que ibán a tener exito de todas formas.
Cálculo de ROI: (Retorno de Inversión) Se transforman las horas de Uplift a dinero real y se les resta lo que cuesta el cupo. Si es positivo, la inversion se paga sola.
Selección Optima: El sistema actúa como un administrador financiero, llenando los cupos disponibles de acuerdo a quien genere el ROI mas alto primero.

Mapa de Dependencias

Dependencias por capa: core, machine learning, visualizacion y metricas.

flowchart TB
    subgraph CORE_BLOCK["Librerias Core"]
        direction LR
        PD["pandas"]
        NP["numpy"]
        SK["scikit-learn"]
        JB["joblib"]
    end

    subgraph VIZ_BLOCK["Visualizaciones"]
        direction LR
        MPL["matplotlib"]
        SNS["seaborn"]
    end

    subgraph METRICS_BLOCK["Metricas"]
        direction LR
        ROC["roc_curve / auc"]
        CAL["calibration_curve"]
        RMSE["mean_squared_error"]
        R2["r2_score"]
    end

    subgraph ML_BLOCK["Librerias ML (V4)"]
        direction LR
        STACK["StackingRegressor\n(sklearn.ensemble)"]
        XGB["xgboost\n(opcional, con fallback)"]
        MLP["MLPRegressor\n(sklearn.neural_network)"]
        RIDGE["Ridge\n(sklearn.linear_model)"]
    end

    CORE_BLOCK --> VIZ_BLOCK
    VIZ_BLOCK --> METRICS_BLOCK
    METRICS_BLOCK --> ML_BLOCK
    STACK --> XGB
    STACK --> MLP
    STACK --> RIDGE

    style CORE_BLOCK fill:#eef,stroke:#7f95cf,color:#21355d
    style VIZ_BLOCK fill:#efe,stroke:#86bf97,color:#265638
    style METRICS_BLOCK fill:#f4f8ff,stroke:#9ab6de,color:#1f4f80
    style ML_BLOCK fill:#ffe,stroke:#d8b56d,color:#654919

Información Técnica Simplificada

Librerías Core (Matemáticas): Tecnología open-source estándar de la industria (pandas, scikit-learn). Garantiza que el código no dependa de proveedores cerrados y sea totalmente auditable.
Fallback (Plan B): Mecanismo de seguridad a prueba de errores. Si el modelo avanzado XGBoost falla por un problema técnico del servidor, el sistema cambia automáticamente a un modelo tradicional (Random Forest) para que sus reportes nunca se detengan.
Métricas (RMSE / R2 / ROC): Pruebas de calidad estrictas que validan matemáticamente que la IA no está "adivinando", sino reconociendo patrones reales y rentables en su negocio.

03 · Cómo Funciona

Dentro del Motor de Inteligencia Artificial

Cada componente cumple una función específica. Aquí explicamos qué hace y por qué importa.

📥

Entrada de Datos

Qué información necesita la IA

La IA necesita un archivo Excel con estas 4 categorías de datos:

👥ParticipantesQuién fue capacitado y quién no

📉Indicadores PreDesempeño antes de capacitar

📈Indicadores PostDesempeño después de capacitar

💰CostosCosto hora por empleado

▼

📊

Comparación de Impacto

Mide si la capacitación realmente funcionó

Se usa el método de Diferencia en Diferencias — una técnica estadística reconocida internacionalmente para medir el efecto real de una intervención:

✅ Capacitados

Mejoran su desempeño → menos retrabajo

VS

❌ No Capacitados

Mantienen o empeoran su desempeño

💡

La diferencia entre ambos grupos es el impacto real.
Se traduce automáticamente a horas ahorradas y dinero no perdido (en CLP) por equipo y por área.

▼

🤖

Motor de Inteligencia Artificial

3 modelos que trabajan en equipo para mayor precisión

VERSIÓN 4.0

Insight AI combina 3 inteligencias artificiales especializadas. Cada una aporta una fortaleza diferente, y un juez final pondera sus opiniones:

Nivel 1: Expertos Especializados

🌲 Árboles Inteligentes

XGBoost — 500 árboles de decisión
Excelente detectando patrones en datos numéricos

🧠 Red Neuronal

MLP — Red de 64→32 neuronas
Captura relaciones complejas y no lineales

Cada experto da su predicción ↓

Nivel 2: Juez Final

⚖️ Ponderador Inteligente

Ridge — Combina ambas predicciones
Asigna el peso óptimo a cada experto

¿Por qué combinar 3 modelos?

Componente	Lo que aporta	Limitación si actúa solo
🌲 Árboles	Precisión con datos numéricos, reglas claras	Puede memorizar datos con pocas muestras
🧠 Red Neuronal	Detecta patrones complejos e interacciones ocultas	Necesita más volumen de datos
⚖️ Ponderador	Combina ambos de forma estable y eficiente	Por sí solo es demasiado simple

▼

🛡️ Robustez de Datos V4

Para evitar que la IA memorice los datos exactos, se introduce una variación controlada muy pequeña (1%) durante el aprendizaje.

Analogía: Es como enseñar con variaciones del mismo examen para que el alumno aprenda el concepto, no la respuesta exacta.

📊 Rangos de Confianza V4

En vez de dar una sola cifra, la IA genera un rango de confianza para cada predicción:

Predicción = $2.450.000 CLP en riesgo
Rango probable = [$2.100.000 — $2.800.000]

Permite tomar decisiones conociendo el mejor y peor escenario.

▼

⚠️

Cálculo de Riesgo Financiero

Cuánto dinero se pierde si no se actúa

La IA traduce sus predicciones a dinero real en riesgo:

Riesgo ($) = Horas de retrabajo predichas × Costo por hora del empleado

Escenario	Qué muestra	Ejemplo
Sin capacitar	Cuánto dinero se pierde si no se hace nada	$42.3M CLP en riesgo total
Capacitando	Cuánto de ese riesgo se puede evitar	$14.7M CLP recuperables

Se calcula en 3 niveles: por persona, por equipo, y por área.

▼

💡

Recomendación con ROI

A quién capacitar para maximizar el retorno

La IA responde la pregunta más valiosa: "¿En quién conviene invertir?"

1Predicción dual

Predice desempeño con y sin capacitación

→

2Beneficio esperado

Calcula horas ahorradas y las traduce a dinero

→

3ROI por persona

Resta el costo del cupo = retorno neto de inversión

→

4Selección óptima

Prioriza por ROI dentro del presupuesto y cupos

Cada candidato recibe: ✅ Seleccionado, ⏳ Lista de espera, o ❌ No recomendado — según su retorno estimado.

▼

📗 Excel Consolidado (20 hojas)

Resumen ejecutivo + Impacto por cohorte/equipo/área + Riesgo financiero detallado + Lista priorizada con ROI por candidato + Verificaciones de calidad de datos.

📊 7 Gráficos Profesionales

Convergencia de entrenamiento, variables más importantes, precisión de predicciones, curva de riesgo, calibración, intervalos de confianza y mapa de riesgo por área.

🔍

Transparencia: Cómo Decide la IA

Las reglas internas se extraen y muestran en español

V4

Para garantizar la explicabilidad ante auditorías e inversores, la IA extrae sus reglas de decisión principales:

SI el desempeño previo es bajo → mayor riesgo predicho
SI el empleado NO fue capacitado → más retrabajo esperado
SI el costo hora es bajo → menor impacto financiero total

Esto garantiza explicabilidad total — un requisito clave para auditoría y toma de decisiones empresariales.

04 · Evolución

Lo Nuevo en la Versión 4.0

Cada mejora fue diseñada para entregar resultados más precisos y confiables.

🤖 Motor Predictivo

1 modelo simple → 3 modelos combinados (Stacking)

🛡️ Entrenamiento

Datos tal cual → Robustez con variación controlada

📊 Confianza

Sin rangos → Rango de confianza en cada predicción

📈 Visualizaciones

0 gráficos → 7 gráficos profesionales automáticos

📝 Reporte

Sin reporte → Reporte ejecutivo completo

🔍 Auditoría

Caja negra → Reglas de decisión extraídas en español

05 · Origen Científico

Tecnología Probada en Física de Partículas

Las técnicas de la versión 4.0 se adaptaron de un proyecto competitivo de detección del bosón de Higgs en el CERN (Laboratorio Europeo de Física Nuclear), garantizando rigor científico de primer nivel.

Técnica del CERN	Adaptación para Insight AI
Combinación de modelos (Stacking)	→ 3 modelos combinados para predicción empresarial
Robustez con ruido controlado	→ Variación del 1% para evitar memorización
Calibración de probabilidades	→ Scores de riesgo confiables y auditables
Análisis de incertidumbre	→ Rangos de confianza en cada predicción
Visualizaciones de validación	→ 7 gráficos adaptados al contexto empresarial
Extracción de reglas del modelo	→ Decisiones traducidas al español

¿Por qué importa? Usar técnicas validadas en física de partículas (uno de los campos más exigentes en análisis de datos) garantiza que los resultados de Insight AI tienen fundamento científico robusto.

Controles InsightAI

Cómo funciona la arquitectura de Insight AI

3 Preguntas que Responde Insight AI

¿Sirvió la capacitación?

¿Qué pasa si NO capacitamos?

¿A quién capacitamos primero?

De los Datos al Resultado en 6 Etapas

Carga de Datos

Medición de Impacto

Entrenamiento de IA

Recomendación Inteligente

Generación de Reportes

Dashboard Interactivo

Diagramas Tecnicos del PDF

Flujo del Pipeline (8 pasos)

Guía de Lectura Rapida

Componentes Detallados

Conceptos Clave

Difference-in-Differences — DiD (lineas 436-536)

¿Que significa este cálculo?

Pipeline de Entrenamiento Completo

Conceptos Clave de Entrenamiento

Uplift y Prescripción (lineas 793-918)

¿Que miden estos pasos?

Mapa de Dependencias

Información Técnica Simplificada

Dentro del Motor de Inteligencia Artificial

Entrada de Datos

Comparación de Impacto

Motor de Inteligencia Artificial

¿Por qué combinar 3 modelos?

🛡️ Robustez de Datos V4

📊 Rangos de Confianza V4

Cálculo de Riesgo Financiero

Recomendación con ROI

📗 Excel Consolidado (20 hojas)

📊 7 Gráficos Profesionales

Transparencia: Cómo Decide la IA

Lo Nuevo en la Versión 4.0

🤖 Motor Predictivo

🛡️ Entrenamiento

📊 Confianza

📈 Visualizaciones

📝 Reporte

🔍 Auditoría

Tecnología Probada en Física de Partículas