Crédit Logement a fait appel à Datastorm pour améliorer ses outils de compréhension et d’analyse des biens immobiliers. Directrice des opérations chez Datastorm et spécialiste du logement, Clara Wolf a piloté ces travaux de modélisation que Crédit Logement a intégré à CL.Estim, un outil qui permet d’estimer finement des biens immobiliers en y intégrant les données vertes : DPE et risques climatiques.
Clara, décrivez-nous le contexte du projet sur lequel Crédit Logement a mobilisé l’expertise de Datastorm.
Clara Wolf : Du fait de la loi Climat et Résilience et l’interdiction prochaine de location des passoires thermiques, le Diagnostic de Performance Energétique (DPE) a de plus en plus d’impact sur les prix immobiliers (cf. les dernières notes des Notaires sur la « valeur verte » des logements). En tant que garant de prêts immobiliers, Crédit Logement a besoin de connaître le DPE d’une part pour évaluer le risque financier pris du fait de la variation du prix du logement, d’autre part pour mieux appréhender les besoins de prêts travaux de rénovation thermique.
Quelle a été la mission de Datastorm ?
C.W. : Notre mission était d’évaluer la faisabilité et la précision avec laquelle nous pouvions estimer le DPE 2021 sur l’ensemble du parc immobilier français. Le DPE n’étant obligatoire que pour les locations et les transactions de logements, une partie du parc n’a pas eu de diagnostic effectué. Enfin, la nouvelle définition du DPE n’étant entrée en vigueur qu’en juillet 2021, peu de DPE 2021 sont disponibles.
Quelles ont été les différentes étapes du projet ?
C.W. : La première étape a été un audit et inventaire des données existantes en Open Data et en interne chez Crédit Logement, ce qui nous a permis d’estimer le DPE des biens immobiliers pour lesquels il n’existait pas. Nous avons notamment utilisé la Base Nationale des Bâtiments ainsi que la base fournie par l’ADEME.
La deuxième étape était une étape de recherche appliquée consistant à choisir les traitements de données appropriés et comparer plusieurs modèles afin de trouver le plus précis et interprétable.
La dernière étape a été de fournir des scripts, des codes et une documentation à Crédit Logement pour que l’industrialisation de notre travail soit la plus aisée possible.
Et qu’ont démontré les modèles ?
C.W. : Comme attendu, l’année de construction du logement est fortement corrélée au DPE. Nous avons pu estimer les DPE à une étiquette près. Néanmoins, il est difficile d’estimer plus précisément le DPE 2021 car il est peu corrélé à l’ancienne définition du DPE qui se basait en partie sur les factures énergétiques. Plus il y aura de DPE 2021 effectués, plus le modèle gagnera en précision, s’il n’y a pas de changements de définition d’ici là.
Plusieurs applications récentes ont montré l’utilité de la science des données et de l’IA pour les problématiques foncières et immobilières.
Ce projet constituait une étude de faisabilité, quelle est la suite ?
C.W. : Le projet a été un succès dans le sens où Crédit Logement a industrialisé ce que nous avons produit et l’a intégré à son outil CL.Estim, une solution qui permet aux banques et professionnels de l’immobilier de répondre aux enjeux réglementaires et opérationnels de l’estimation de biens immobiliers résidentiels. CL.Estim permet en effet d’estimer finement des portefeuilles de biens, et des biens unitaires, en y intégrant les données vertes, c’est–à-dire le DPE et les données liées aux risques climatiques.
Le monde de l’immobilier semble en retard par rapport à d’autres secteurs qui utilisent massivement la donnée. Qu’est-ce qui explique ce retard selon vous ?
C.W. : L’utilisation de la donnée est de plus en plus répandue dans le monde immobilier. La mise à disposition en Open Data des Demandes de Valeur Foncière (DVF) regroupant toutes les transactions, leurs adresses et leur prix, a marqué une rupture. Mais il y a effectivement encore des freins à l’utilisation des données immobilières :
– toutes les procédures ne sont pas dématérialisées, même si des efforts conséquents sont fait dans ce sens par la puissance publique.
– Une partie des données ne sont pas en Open Data, par exemple la base de données DV3F qui regroupe des caractéristiques sur les logements, les données MAJIC des personnes physiques, les données de consommation d’énergie (électricité et gaz)…
– Il existe encore de nombreuses données propriétaires dans les réseaux d’agences immobilières et les portails d’annonces.
Tous ces freins peuvent s’expliquer par des problématiques de confidentialité et de RGPD – par exemple il semble sensé que les données fiscales au niveau cadastral ne soient pas disponibles en Open Data – et bien sûr par des enjeux commerciaux.
Nous avons parlé rénovation thermique, sur quels autres sujets la science des données et l’intelligence artificielle peuvent-elles être utilisées dans l’immobilier ?
C.W. : Plusieurs applications récentes ont montré l’utilité de la science des données et de l’IA pour les problématiques foncières et immobilières. La publication des transactions DVF a ainsi permis de développer des modèles de machine learning d’estimation des prix immobiliers. C’était d’ailleurs le sujet central du Business Data Challenge que Datastorm a organisé cette année avec l’ENSAE Paris et Meilleurtaux.
Autre exemple : la Direction générale des finances publiques a pu repérer les piscines et les bâtis non déclarés en utilisant des techniques de Computer Vision et des images satellites. Les mêmes algorithmes de Computer Vision permettront sûrement de mieux mesurer la consommation foncière et l’étalement urbain. N’oublions pas les données sur le bâti et sur les terrains : la pente et l’orientation du toit permettent de mesurer le rendement de panneaux photovoltaïques, la nature des sols, la topographie, la vue depuis les logements permettraient une estimation plus précise du prix des terrains et des logements, etc.
Science des données, IA et immobilier : nous n’en sommes donc qu’aux premiers usages ?
Oui, nous en sommes aux prémices. D’autant plus que le risque climatique et la transition écologique vont très fortement impacter le secteur de l’immobilier dans les prochaines décennies. Tous les acteurs de la chaine sont concernés et vont devoir se doter d’outils d’analyse robustes et performants pour gérer au mieux cette transition.
A propos de Crédit Logement
Crédit Logement est un acteur essentiel du marché du financement de l’habitat résidentiel en France et travaille en partenariat avec la grande majorité des banques françaises et garantit un prêt immobilier sur trois. Crédit Logement est une Société de Financement supervisée par l’Autorité de Contrôle Prudentiel et de Résolution ACPR. Ses actionnaires sont les grandes banques françaises.
https://www.creditlogement.fr/
Image de kjpargeter sur Freepik