800 documenten per maand geboekt zonder er één te typen
Een boekhoudkantoor verzoop in PDF's, foto's en scans van zijn klanten. We bouwden een pijplijn die die chaos omzet in boekingen klaar om in de boekhoudsoftware te duwen.
Details geanonimiseerd en aangepast om vertrouwelijkheidsredenen.
Het probleem
Een boekhoudkantoor van een vijftiental mensen. Bij elke maandafsluiting sturen klanten hun documenten in elk denkbaar formaat: scheef gescande PDF’s, foto’s van kassabonnen met flits, bankexports als CSV waarvan de kolommen van bank tot bank verschillen, leveranciersfacturen verstopt in bijlagen.
Een boekhouder besteedde gemiddeld 3 tot 4 uur per dossier per maand aan alles openen, lezen en manueel overtypen in de software. Over 60 actieve dossiers is dat meer dan 200 uur pure invoer per maand. Het echte werk, analyse en advies, kwam als laatste.
Wat we bouwden
Universele inzameling - Eén dropbox per klant (e-mail plus web-sleepveld). PDF, JPG, scans, bank-CSV’s, maakt niet uit. Alles komt op één plaats terecht, met tijdstempel en gekoppeld aan het juiste dossier.
AI-extractie - Een OCR-plus-taalmodelpijplijn die elk document leest en de gestructureerde velden eruit haalt: leverancier, datum, bedragen excl. en btw, tarief, factuurnummer, munt. Bankuittreksels worden lijn per lijn ontleed, ongeacht het formaat van de bank.
Regels en rekeningstelsel - Automatische toewijzing aan de juiste rekeningen op basis van de leverancier en de dossierhistoriek. Het systeem leert uit eerdere correcties en stelt vanaf de tweede keer de juiste kostenrekening voor.
Gerichte menselijke controle - Niets wordt blind doorgeduwd. Een validatie-interface toont enkel de twijfelachtige documenten (onleesbaar bedrag, incoherente btw, onbekende leverancier). De rest valideer je met één klik.
Het resultaat
- Van 3-4 u naar 35 min per dossier per maand. De boekhouder valideert in plaats van te typen.
- Meer dan 90% van de documenten geëxtraheerd zonder tussenkomst, de rest gemarkeerd voor controle.
- Ongeveer 160 uur per maand teruggegeven aan het team, herinvesteerd in klantenadvies.
- Btw-afwijkingen vroeg gedetecteerd, voor de fout in de aangifte belandt.
- Directe export naar de bestaande boekhoudsoftware, zonder van tool te wisselen.
De stack
- OCR plus taalmodel voor gestructureerde documentextractie
- Python-pijplijn die inzameling, parsing en boekhoudkundige toewijzing orkestreert
- Eigen regellaag die leert uit de correcties van de boekhouder
- Lichte web-validatie-interface voor gerichte controle
- Exportconnector naar de reeds aanwezige boekhoudsoftware