Problem
Ein Agri-Tech-Kreditgeber musste Kredit an SMB-Bauern und Lebensmittelproduzenten ohne traditionelle Credit-Bureau-Abdeckung vergeben. Das verfügbare Signal waren rohe Rechnungsdaten — Bestellungen, Zahlungshistorien, Lieferantenbeziehungen, Saisonalitätsmuster — in unstrukturierten PDFs und Buchhaltungs-Exporten über das bestehende Borrower-Book.
Ansatz
End-to-End-Pipeline von Rechnungs-Ingestion bis Kreditscoring gebaut. Rechnungs-Parsing und Entity-Extraktion zur Normalisierung von Gegenparteien, Inferenz der Zahlungskonditionen, Modellierung der Cashflow-Saisonalität, und eine Kreditscoring-Schicht, die rechnungsabgeleitete Features mit verfügbaren strukturierten Daten kombiniert. Besondere Aufmerksamkeit auf das „Thin File"-Problem — Borrower mit Monaten statt Jahren Historie.
Stack
Python ML pipeline · invoice parsing / OCR layer · scikit-learn / XGBoost · feature store · scoring API
Ergebnis
Eine Kredit-Entscheidungs-Schicht, die der Kreditgeber auf Borrowers laufen lassen kann, die traditionelle Bureaus nicht abdecken. Das Modell produziert sowohl einen Score als auch eine Per-Feature-Attribution (welche rechnungsabgeleiteten Signale die Entscheidung trieben), sodass Credit Officers Einzelfälle prüfen und überschreiben können — erforderlich für regulierte Kreditreview.