NewsRoom

Congrès ISNPS : nous y étions !

R&D 12 juillet 2024

La conférence biannuelle International Symposium on Nonparametric Statistics (ISNPS) s’est déroulée à Braga, au Portugal, du 25 au 29 juin 2024. Cet événement a mis en lumière les dernières avancées et tendances dans le domaine des statistiques non paramétriques, essentielles pour l’analyse de données non linéaires et complexes, souvent mal adaptées aux modèles paramétriques de Machine Learning. 

Hassan Maissoro a contribué à cette conférence en présentant une méthode innovante de prévision de trajectoire, basée sur la théorie l’analyse des données fonctionnelles, appliquée à la prévision des courbes de tension électrique. Cette étude, réalisée avec ses directeurs de thèse Valentin Patilea et Myriam Vimond, chercheurs au CREST ENSAI-ENSAE, sera prochainement publiée sous le titre « Adaptive Prediction for Functional Time Series ». 

La prévision de la consommation électrique des ménages est cruciale pour l’équilibre de la charge électrique, et la qualité de cette prévision représente un enjeu économique majeur. Les résultats présentés, basés sur la théorie des données fonctionnelles, proposent des prévisions de trajectoires de tension électrique de meilleure qualité que celles obtenues par les modèles classiques de Machine Learning.  

L’étude utilise des données réelles open-source de consommation d’électricité d’un ménage à Sceaux, au pas de temps d’une minute, en se concentrant sur la prévision à court terme de la trajectoire de tension électrique. L’unité d’observation est la courbe de tension électrique journalière entière. Par exemple, sur une année, cela représente 365 à 366 trajectoires de tension électrique, constituant une série temporelle fonctionnelle.  

Partant d’une collection de courbes journalières de tension électrique, l’étude intègre une phase de simulation de nouvelles données à partir de ces trajectoires réelles, afin de permettre une analyse critique de la robustesse de la prévision de la trajectoire de l’après-midi à partir des données réelles de la matinée. Avec l’analyse de données fonctionnelles, il est également possible de prévoir la trajectoire de la tension électrique du lendemain et de faire des prévisions à moyen et long terme en utilisant, par exemple, un modèle auto-régressif fonctionnel.

Cette étude s’inscrit dans le cadre d’une collaboration avec le CREST ENSAI-ENSAE sur les données fonctionnelles, un domaine encore peu exploré et utilisé dans un contexte industriel avec des données réelles. Les données fonctionnelles sont particulièrement utiles lorsqu’on dispose d’un ensemble de séries temporelles, comme les mesures temporelles de capteurs, permettant d’exploiter l’information contenue dans chaque série ainsi que celle disponible à travers les séries en considérant chaque série temporelle comme la réalisation d’une seule variable aléatoire sous forme de fonction, trajectoire ou courbe.  

Parmi les autres sujets abordés lors de cette conférence, l’analyse topologique des données a suscité un intérêt particulier. Cette technique, en pleine expansion depuis une vingtaine d’années dans la recherche en statistiques, reste peu utilisée en data science. Elle permet d’utiliser la structure topologique des données pour modéliser des phénomènes non linéaires, en exploitant plus d’informations lors de la modélisation. Les informations extraites peuvent notamment inclure une collection de courbes, c’est-à-dire des données fonctionnelles. Ces techniques permettent d’injecter des données complexes, telles que des pièces mécaniques modélisées, des bases de données graphes ou des résultats d’IRM, dans des modèles.  

Pour en savoir plus sur les données fonctionnelles, DataStorm a publié une interview introductive d’Hassan Maissoro qui présente les enjeux de sa thèse sur le sujet. Les premiers articles d’Hassan ont récemment été publiés sur arXiv.

Liens : 

 

La conférence ISNPS 2024 a été un événement passionnant pour tout celles et ceux qui s’intéressent aux dernières avancées en matière de statistiques non-paramétriques et à leurs applications dans le domaine de la data science.