Budget Forecast vs Machine Learning
Utiliser les modèles de Machine Learning pour améliorer les prévisions du budget
Contexte
'“Notre budget est systématiquement faux de 10-15%." Cette phrase, prononcée par le CFO d'un groupe industriel de métallurgie sous LBO, résume parfaitement la frustration de centaines de directeurs financiers. Chaque mois, c'est la même histoire : on compare le réel au budget, on constate l'écart, on s'excuse en board, et on recommence.
Pourtant, ce CFO pilote une belle ETI : 320M€ de chiffre d'affaires, 5 sites de production, 1200 salariés. Son équipe finance est compétente. Ses outils sont à jour. Mais son forecast est trop décalé.
Anatomie d'un forecast qui déraille
Prenons les chiffres réels de cette entreprise (anonymisés, bien sûr). Sur 2023, leur méthode de prévision traditionnelle affichait une erreur moyenne de 9%. Ça peut paraître acceptable, mais regardons de plus près :
Août : -15% d'erreur (ils avaient oublié que l'usine ferme 2 semaines)
Novembre : +12% d'erreur (le pic de commandes automobile était sous-estimé)
Mars : -8% d'erreur (les prix de l'aluminium avaient flambé)
9% d'erreur sur 320M€ de CA, c'est 28M€ d'incertitude par an. C'est l'équivalent du BFR de 2 mois d'activité qui se balade dans la nature.
Les 3 erreurs classiques du forecast
Erreur n°1 : Ignorer la saisonnalité réelle
L'équipe finance savait qu'août était creux. Mais dans leur modèle Excel, ils appliquaient -10% sur la moyenne. Sauf que l'impact réel était de -25% certaines années. On raisonnait en moyennes au lieu d'analyser les patterns.
Erreur n°2 : Négliger les variables externes
Le prix de l'aluminium impacte directement les marges et donc les décisions de production. Le carnet de commandes automobile influence les volumes. Mais dans le budget Excel, on mettait une ligne droite avec +3% de croissance.
Erreur n°3 : Ne pas quantifier le savoir des commerciaux
"Je connais mon business, je sens que Q4 sera bon." Cette phrase, tous les directeurs commerciaux l'ont prononcée. Et souvent, ils ont de bonnes raisons de le penser. Mais si on ne transforme pas ce savoir en données mesurables et exploitables, il reste inutilisable pour améliorer le forecast. Ce n'est pas l'intuition qu'il faut exclure, c'est son absence de traduction concrète dans les modèles.
Comment le Machine Learning change la donne
Nous avons implémenté et comparé 4 méthodes de prévision sur les données réelles de notre client. La comparaison se fait en utilisant l’indicateur MAPE.
Pourquoi le MAPE ? Le MAPE (Mean Absolute Percentage Error) est l'indicateur de référence pour mesurer l'écart moyen entre les prévisions et les réalisés, exprimé en pourcentage du réel. Plus le MAPE est bas, plus votre prévision est précise.
1. Le budget Excel actuel
Comment ça marche : L'équipe FP&A récupère les chiffres N-1, applique une hypothèse de croissance forfaitaire de +3% (alignée sur les tendances historiques et les attentes du COMEX), puis affine via des entretiens avec les commerciaux, la direction des achats et les responsables de sites. Le travail est rigoureux, mais repose sur des ajustements décentralisés souvent peu formalisés et difficilement consolidables dans un modèle dynamique.
MAPE : 8.4%
Problème : Reflète partiellement la réalité du business, mais ne permet pas de capturer les dynamiques sous-jacentes ni de réagir aux signaux faibles ou aux variations brutales.
2. La moyenne mobile
Comment ça marche : On fait la moyenne des 3 derniers mois
MAPE : 6.3%
Pourquoi c'est mieux : On suit la tendance récente
Mais : On rate les effets saisonniers
3. Le modèle saisonnier
Comment ça marche : On analyse les patterns par mois sur 5 ans, puis on applique une croissance moyenne annuelle (ici +3%) pour projeter les valeurs de l'année suivante. Ce modèle capture bien la saisonnalité récurrente (comme le creux d'août ou le pic de novembre), mais reste sensible aux aléas exceptionnels.
MAPE : 4.6%
L'insight : Août n'est pas juste "un peu creux", c'est -25% systématiquement
4. Le Machine Learning
Comment ça marche : On nourrit l'algorithme avec toutes les données disponibles:
Carnet de commandes
Prix des matières premières
Historique des ventes
Jours ouvrés, fériés
Autres variables utilisées (coûts RH, capacité machine, taux d'absentéisme,…)
L’objectif est de lui faire “apprendre” les patterns historiques entre ces variables et le chiffre d’affaires, pour pouvoir ensuite prédire les mois futurs avec plus de justesse.
Il est entraîné sur les données passées, puis testé sur une année pour vérifier s’il "devine" correctement sans l’avoir vue
MAPE : 3%
La différence : l’algorithme capte les interactions complexes, détecte des signaux faibles, et apprend les cycles internes du business.
Le modèle a identifié que le carnet de commandes à J-30 est la variable la plus prédictive du chiffre d'affaires mensuel (64% d'importance dans le modèle)
En second, le pipeline commercial compte pour 27% : il ne prédit pas le mois suivant, mais est utile pour anticiper un trimestre ou une dynamique générale.
L'algorithme a donc structuré une intuition souvent connue mais rarement quantifiée
L'impact business
Passer d’un MAPE de 8.4% à 3% a permis à l’équipe finance de regagner en fiabilité et en capacité d’anticipation.
Visibilité accrue : les écarts mensuels ont été divisés par trois, réduisant les imprévus et les tensions de trésorerie.
Meilleure planification : en anticipant les variations de chiffre d'affaires, l’entreprise a pu ajuster ses achats, son organisation et ses stocks plus finement.
Réduction du BFR : la meilleure prévision a permis d’éviter des surstocks et de lisser certains engagements de trésorerie, libérant une partie du besoin en fonds de roulement.
Les pièges à éviter
Vouloir tout prédire: 3% d'erreur, c'est excellent. 0%, c'est impossible.
Ignorer le métier: Une bonne modélisation ne vaut que si elle repose sur une compréhension fine du métier.
Complexifier inutilement : 200 variables = 2.9% d'erreur. Temps de calcul x10. Simplicité > complexité.
Oublier l'objectif: Le meilleur algo est inutile si personne ne l'utilise.
Croire que c'est fini : Le modèle de 2023 sera obsolète en 2025. C'est un process, pas un projet.
Ce que ça suppose en amont
Ce type de démarche ne fonctionne que si certaines conditions sont réunies. Avant même de parler d’algorithme, il a fallu :
Consolider un historique propre du chiffre d’affaires mensuel, site par site
Recenser et fiabiliser les données du pipeline commercial, carnet de commandes, et indicateurs marché
Comprendre les dynamiques de vente à travers des échanges avec les équipes commerciales, la direction des achats, voire certains clients clefs
La plus grande partie du travail n’a pas été technique :
Nettoyage, harmonisation et structuration des données (près de 60% de la mission)
Construction et test des modèles (saisonnier, ML, etc.)
Transmission à l’équipe contrôle de gestion, pour que les outils soient compréhensibles et utilisables de façon autonome
Conclusion
Ce cas montre la valeur d’une approche rigoureuse, structurée, et bien ancrée dans la réalité terrain.
Nous avons travaillé avec des données imparfaites, incomplètes, hétérogènes comme dans toutes les entreprises. L’essentiel a été de structurer et de consolider ce qui existe déjà, sans avoir à impléme,ter une infrastructure data/IT lourde.
Ensuite, la modélisation a permis de révéler ce que l’intuition métier pressentait souvent, mais sans pouvoir le quantifier.
Chez REKOLT, nous aidons les équipes finance à reprendre le contrôle sur leur prévision avec des modèles transparents, reproductibles, que vos équipes comprennent et peuvent adapter.
Envie d'en discuter ? On commence toujours par un audit des données existantes.