Problema
Un lender agri-tech aveva bisogno di estendere credito a coltivatori PMI e produttori alimentari senza copertura tradizionale di credit bureau. Il segnale disponibile era dato fattura raw — purchase order, storia dei pagamenti, relazioni con fornitori, pattern di stagionalità — che giaceva in PDF non strutturati ed export contabili attraverso il book esistente del borrower.
Approccio
Costruita una pipeline end-to-end dall'ingestion fatture al credit scoring. Parsing fatture ed estrazione di entity per normalizzare le controparti, inferenza dei termini di pagamento, modellazione della stagionalità di cash-flow, e un layer di credit-scoring che combinava feature derivate dalle fatture con dati strutturati disponibili. Attenzione speciale al problema "thin file" — borrower con mesi anziché anni di storia.
Stack
Python ML pipeline · invoice parsing / OCR layer · scikit-learn / XGBoost · feature store · scoring API
Risultato
Un layer di credit-decisioning che il lender può far girare su borrower che i bureau tradizionali non coprono. Il modello produce sia uno score sia un'attribuzione per-feature (quali segnali derivati dalle fatture hanno guidato la decisione), così i credit officer possono fare audit e override di casi singoli — richiesto per la review di lending regolamentato.