La empresa de gestión de proyectos de construcción Trunk Tools logró reducir sus ciclos de revisión documental de entre 50 y 60 días a tan solo 10, gracias a una arquitectura de inteligencia artificial diseñada específicamente para las complejidades del sector. En lugar de apoyarse en modelos de lenguaje de propósito general, la compañía construyó un sistema de tres capas —percepción, semántica y agentes— capaz de procesar millones de páginas de documentación técnica con una precisión cercana al 95%.
El punto de partida fue reconocer una limitación fundamental de los grandes modelos de lenguaje (LLM) convencionales: están optimizados para la amplitud, no para la profundidad. Como señalan expertos en infraestructura de IA, estos sistemas son entrenados para desempeñarse de manera aceptable en casi cualquier tarea, lo que los hace débiles cuando se trata de dominios muy especializados. En sectores como la construcción, el derecho o la salud, los documentos están repletos de jerga técnica, abreviaturas específicas y formatos propietarios que los modelos generalistas suelen malinterpretar o simplificar en exceso.
Otro obstáculo es que los datos más valiosos de las empresas nunca llegaron a los conjuntos de entrenamiento de los modelos fundacionales. Esa información vive en sistemas internos y formatos privativos. Técnicas como la generación aumentada por recuperación (RAG) ayudan parcialmente, pero no resuelven el problema de fondo: un modelo que no razona bien en un dominio específico seguirá cometiendo errores aunque se le suministren hechos más precisos.
La arquitectura de Trunk Tools ataca ese problema desde su raíz. La primera capa, llamada de percepción, se encarga de leer y extraer información de documentos complejos: planos en PDF, escaneos, tablas de especificaciones. En construcción, los símbolos gráficos tienen significados muy precisos según su ubicación —una figura de apenas dos milímetros puede representar elementos completamente distintos—, algo que los transformadores probabilísticos convencionales no interpretan con la exactitud requerida.
La segunda capa, semántica, organiza esa información extraída en un grafo de conocimiento que establece relaciones entre datos: conecta una puerta en un plano con la especificación técnica que la rige, el contratista que la instala y los posibles conflictos con otros elementos del proyecto. Esta capa es la que permite responder preguntas críticas para un ingeniero de obra, no si existe un elemento en un plano, sino si ese elemento generará un problema en el futuro. Sobre ambas capas, la tercera despliega los agentes de IA que ejecutan flujos de trabajo autónomos.
Sarah Buchner, fundadora y directora ejecutiva de Trunk Tools —y ex carpintera de oficio—, explica que el volumen de datos no estructurados en un proyecto de construcción es sencillamente imposible de procesar de forma manual. Un rascacielos promedio genera alrededor de 3,6 millones de páginas de documentación asociada; impresa, esa pila de papeles alcanzaría la altura del propio edificio. El costo de los errores, además, crece exponencialmente con el tiempo: detectar un conflicto en la fase de diseño puede costar relativamente poco, mientras que el mismo problema identificado ya en obra puede suponer decenas de miles de dólares en correcciones.
La plataforma actualmente opera siete agentes especializados. El agente de revisión de remisiones, por ejemplo, compara especificaciones de productos con los requisitos del proyecto e identifica información faltante, contradictoria o que no cumple la normativa, una tarea que manualmente exigía cotejar múltiples secciones de documentos de forma simultánea. Los clientes reportan ahorros de tiempo que van desde ocho minutos para consultas en un solo documento hasta 75 minutos en tareas complejas de análisis cruzado. En casos documentados, el sistema detectó que una viga estructural había sido desplazada 8,5 pulgadas sin que el arquitecto lo registrara —lo que hubiera implicado al menos 10.000 dólares en reparaciones—, identificó 60.000 dólares en cargos inflados por parte de subcontratistas de jardinería y evitó un error de instalación en una chimenea que habría costado cerca de 100.000 dólares en mano de obra y materiales.
Los modelos de los tres niveles se entrenan con conjuntos de datos muy específicos, obtenidos de clientes con permisos explícitos. La información se desidentifica y agrega, y los clientes que prefieren no compartir sus datos con fines de entrenamiento pueden optar por no hacerlo. La compañía solo lanza al mercado agentes que superan un umbral de precisión del 95%, validado mediante evaluaciones continuas con datos reales aportados por clientes y expertos del sector, así como un sistema en el que un LLM actúa como juez para medir tanto el desempeño objetivo como la calidad subjetiva de las respuestas generadas.
Para otras industrias que manejan grandes volúmenes de datos no estructurados, el enfoque de Trunk Tools ofrece una hoja de ruta concreta. La clave está en transformar primero el caos documental en estructuras que los modelos puedan recorrer con lógica, construir después las conexiones entre esos datos y, solo entonces, desplegar flujos de trabajo agénticos. Con la inversión global en modelos fundacionales en constante crecimiento, la recomendación de Buchner es construir sistemas modulares que puedan aprovechar lo mejor de cada modelo disponible, mientras se desarrolla ventaja técnica propia precisamente en los territorios donde los modelos genéricos no invierten ni rinden bien.