Problème
Un prêteur agri-tech avait besoin d'étendre du crédit aux agriculteurs PME et producteurs alimentaires sans couverture traditionnelle de credit bureau. Le signal disponible était de la donnée de facture brute — bons de commande, historique de paiements, relations fournisseurs, patterns de saisonnalité — assise dans des PDFs non structurés et des exports comptables à travers le book existant du borrower.
Approche
Pipeline construite de bout en bout, de l'ingestion de factures au scoring crédit. Parsing de factures et extraction d'entités pour normaliser les contreparties, inférence des termes de paiement, modélisation de la saisonnalité de cash-flow, et une couche de scoring crédit combinant features dérivées des factures avec données structurées disponibles. Attention particulière au problème "thin file" — borrowers avec des mois plutôt que des années d'historique.
Stack
Python ML pipeline · invoice parsing / OCR layer · scikit-learn / XGBoost · feature store · scoring API
Résultat
Une couche de credit-decisioning que le prêteur peut faire tourner sur des borrowers que les bureaus traditionnels ne couvrent pas. Le modèle produit à la fois un score et une attribution par feature (quels signaux dérivés des factures ont guidé la décision), donc les credit officers peuvent auditer et overrider des cas individuels — requis pour la revue de lending réglementé.