Automatische extractie van hoeveelheidsstaten
Een structuurstudiebureau verloor 3 tot 4 uur per project aan het manueel overtypen van gegevens tussen PDF-plannen, Excel-tabellen en rekensoftware. We automatiseerden dat alles.
Representatief scenario gebaseerd op echte opdrachten. Namen, cijfers en contexten zijn aangepast om vertrouwelijkheidsredenen.
Het probleem
Een studiebureau van 8 ingenieurs. Elk structuurproject begint met dezelfde corvee: de PDF-plannen van de klant openen, de te dimensioneren elementen opsporen, de afmetingen in een Excel-tabel kopiëren, en dat vervolgens overbrengen naar de rekensoftware. Manueel. Elke keer.
3 tot 4 uur verloren per project. Op 3 tot 4 parallelle projecten komt dat neer op anderhalve dag puur mechanisch werk per week - per ingenieur.
En fouten sluipen erin. Een verkeerd overgetypt cijfer, een vergeten sectie. Niemand ziet ze tot de rekenresultaten niet kloppen.
Wat we gebouwd hebben
Een Python-pipeline die een PDF-plan als invoer neemt en een gestructureerde hoeveelheidsstaat als uitvoer produceert, klaar om te importeren in hun rekensoftware.
Extractie uit PDF’s - herkenning van structurele elementen (balken, kolommen, platen, funderingen), lezen van maatvoeringen, identificatie van sectietypes.
Automatische structurering - de gegevens worden georganiseerd in het exacte formaat dat door de software van het team verwacht wordt. Geen tussenliggende manipulatie.
Validatie en alerts - het systeem signaleert onzekere zones (slecht leesbare plannen, ontbrekende maatvoeringen) zodat de ingenieur zijn controle concentreert waar het telt.
De voornaamste moeilijkheid: plannen met handmatige annotaties van klanten. Standaard OCR houdt geen stand op dichte handgeschreven teksten. We voegden een detectielaag toe voor onzekere zones met gerichte handmatige validatievraag - de ingenieur herbekijkt alleen de 10 tot 15% elementen die het systeem niet met voldoende vertrouwen verwerkt.
De resultaten
- 2u30 bespaard per project gemiddeld (varieert naargelang de complexiteit van de plannen)
- Automatische detectierate: 86% van de elementen zonder menselijke tussenkomst
- Terugverdiend in 4 weken op het projectvolume van het team
- De ingenieurs doen berekeningen, niet data-invoer
Stack
- Python - PDF-extractie, datastructurering
- Vectorparsing + gerichte OCR op gedegradeerde zones
- Export naar het native formaat van de rekensoftware
- Lokale implementatie (gevoelige gegevens, geen cloud)