Automatische extractie van hoeveelheidsstaten

Een structuurstudiebureau verloor 3 tot 4 uur per project aan het manueel overtypen van gegevens tussen PDF-plannen, Excel-tabellen en rekensoftware. We automatiseerden dat alles.

Details geanonimiseerd en aangepast om vertrouwelijkheidsredenen.

Het probleem

Een studiebureau van 8 ingenieurs. Elk structuurproject begint met dezelfde corvee: de PDF-plannen van de klant openen, de te dimensioneren elementen opsporen, de afmetingen in een Excel-tabel kopiëren, en dat vervolgens overbrengen naar de rekensoftware. Manueel. Elke keer.

3 tot 4 uur verloren per project. Op 3 tot 4 parallelle projecten komt dat neer op anderhalve dag puur mechanisch werk per week - per ingenieur.

En fouten sluipen erin. Een verkeerd overgetypt cijfer, een vergeten sectie. Niemand ziet ze tot de rekenresultaten niet kloppen.

Wat we gebouwd hebben

Een Python-pipeline die een PDF-plan als invoer neemt en een gestructureerde hoeveelheidsstaat als uitvoer produceert, klaar om te importeren in hun rekensoftware.

Extractie uit PDF’s - herkenning van structurele elementen (balken, kolommen, platen, funderingen), lezen van maatvoeringen, identificatie van sectietypes.

Automatische structurering - de gegevens worden georganiseerd in het exacte formaat dat door de software van het team verwacht wordt. Geen tussenliggende manipulatie.

Validatie en alerts - het systeem signaleert onzekere zones (slecht leesbare plannen, ontbrekende maatvoeringen) zodat de ingenieur zijn controle concentreert waar het telt.

De voornaamste moeilijkheid: plannen met handmatige annotaties van klanten. Standaard OCR houdt geen stand op dichte handgeschreven teksten. We voegden een detectielaag toe voor onzekere zones met gerichte handmatige validatievraag - de ingenieur herbekijkt alleen de 10 tot 15% elementen die het systeem niet met voldoende vertrouwen verwerkt.

De resultaten

2u30 bespaard per project gemiddeld (varieert naargelang de complexiteit van de plannen)
Automatische detectierate: 86% van de elementen zonder menselijke tussenkomst
Terugverdiend in 4 weken op het projectvolume van het team
De ingenieurs doen berekeningen, niet data-invoer

Stack

Python - PDF-extractie, datastructurering
Vectorparsing + gerichte OCR op gedegradeerde zones
Export naar het native formaat van de rekensoftware
Lokale implementatie (gevoelige gegevens, geen cloud)

Het probleem

Wat we gebouwd hebben

De resultaten

Stack

Een probleem vergelijkbaar met een van deze?