M2Predict

Estimation prix / m²

Estimation du prix au metre carre pour l'immobilier residentiel en France, propulse par le machine learning.

Parametres

Lancez une estimation

Remplissez les parametres et cliquez sur Estimer

Methodologie

Comment fonctionne la prediction

Notre modele s'appuie sur les donnees DVF (Demande de Valeurs Foncieres), un jeu de donnees public de transactions immobilieres en France.

Dataset DVF
Donnees de transactions immobilieres

1,39M

Lignes brutes

390K

Apres nettoyage

5 830

Codes postaux

Nettoyage applique

  • Uniquement Maisons et Appartements
  • Surface ≥ 10 m², valeur fonciere > 0
  • Prix/m² filtre entre 200 et 60 000 EUR
  • Mediane finale : 2 685 EUR/m²
Target Encoding
Encodage geographique retenu

Le code postal est remplace par le prix moyen au m² observe dans cette zone (calcule uniquement sur le jeu d'entrainement). Cette technique compresse 5 830 colonnes one-hot en une seule variable a fort signal geographique.

Parametres

MethodeKFold OOFSmoothing20FallbackMoyenne globale
MAE amelioree de ~2 150 a ~1 700 EUR/m²
Modeles compares
Performances sur le jeu de test
ModeleRMSEMAE
RF (One-Hot)41762150
HGB (One-Hot)40752014
RF (Departement)42012012
HGB (Departement)42171969
RF + TE (v1_rf_te)37371701
HGB + TE (v1_hgb_te)38231746
Meilleure precision brute : RandomForest + TE
Score de confiance
Systeme d'incertitude par modele

RandomForest

Predictions de tous les arbres, percentiles q10/q90 de la distribution.

rf_tree_quantile_width

HGB Bootstrap

10 modeles sur echantillons bootstrap, dispersion des predictions.

hgb_bootstrap_width

Interpretation

≥ 0.80
Tres fiable
0.65 – 0.80
Fiable
0.50 – 0.65
Incertain
< 0.50
Risque
Pipeline de prediction
Etapes internes lors d'une requete
1

Extraction departement

Les 2 premiers chiffres du code postal

2

Target Encoding

cp → prix_m2 moyen, fallback moyenne globale

3

Prediction

Passage dans le pipeline scikit-learn

4

Calcul d'incertitude

Quantiles q10/q90 via arbres ou bootstrap

5

Score de confiance

Normalise entre p5 et p95 observes au training