Connaître le profil socio-économique de chaque ménage à l'adresse : le jeu de données EMMA
Publié le 12 août 2025 · Mis à jour le 5 mai 2026 · Catalogue de données IMOPE
Les données socio-économiques décrivent les caractéristiques des ménages. Dans la base IMOPE, deux approches complémentaires sont disponibles à l'adresse :
→ Les données carroyées FILOSOFI (INSEE) : une valeur moyenne statistique par carreau, imputée aux adresses par jointure spatiale.
→ Les données EMMA prédites par U.R.B.S. : un profil socio-économique attribué de façon indépendante à chaque logement, permettant une descente d'échelle à l'adresse inégalée.
Méthodologie
- Données carroyées INSEE inférées à la maille du bâtiment
- Toutes les adresses d'un même carreau partagent les mêmes valeurs
- Représentation moyenne zonale : tend à uniformiser les profils au sein d'un carreau
- Disponible en accès grand public
- Profil socio-économique attribué logement par logement
- Descente d'échelle à l'adresse, indépendante du carreau
- Appui aux politiques publiques : rénovation, aller-vers, PLH…
- Disponible sous licence dans ONB+
Le modèle EMMA en détail
EMMA (Évaluation Modélisée des Ménages à l'Adresse) repose sur une hypothèse centrale : il existe une corrélation significative entre les caractéristiques d'un logement et le profil des ménages qui l'occupent. Le modèle s'appuie sur deux bases de données croisées :
- La base IMOPE (millésime 2025) — caractérisation fine et géolocalisée du parc de locaux sous toutes ses dimensions : technique, énergétique, urbanistique.
- Les fichiers détails logements INSEE (millésime 2021) — description unitaire du parc avec les caractéristiques socio-démographiques des ménages à l'IRIS.
Un indice de similarité est calculé entre les logements INSEE et les locaux IMOPE à partir de variables communes : période constructive, typologie de logement, classe de surface. L'affectation est ensuite optimisée pour maximiser cet indice. Les caractéristiques socio-économiques ainsi connectées constituent le jeu de données EMMA.
Le jeu de données EMMA couvre les résidences principales non vacantes de type maison ou appartement, soit 30 millions de logements sur plus de 18 millions d'adresses en France métropolitaine.
Fiabilité du modèle
Mesure la qualité de l'appariement entre logements INSEE et locaux IMOPE (de 0 à 1). À l'échelle nationale, l'indice de similarité moyen est de 0,94 — une valeur extrêmement élevée.
Qualifie la pertinence du choix lorsque plusieurs logements maximisent le même indice de similarité. Elle tient compte du nombre de candidats et de la diversité de leurs modalités socio-économiques.
Une étude de comparaison terrain a été conduite sur deux départements partenaires (Isère et Pyrénées-Atlantiques) sur l'attribut âge des propriétaires. La fiabilité à ±1 classe dépasse 70 % : bonne réponse dans 7 cas sur 10 — niveau jugé « bon ».
Limites à connaître
- Les valeurs sont des moyennes de carreau et peuvent masquer des situations individuelles très différentes (ex. : ménage à revenus élevés dans un carreau à faibles revenus moyens).
- Des écarts individuels peuvent apparaître lors de visites terrain, notamment en raison du décalage de millésime entre les fichiers INSEE (2021) et les observations actuelles.
- L'hypothèse centrale du modèle montre ses limites pour des bâtiments homogènes accueillant des profils de ménages hétérogènes.
- À l'inverse, les résultats sur les adresses à fort nombre de logements sont bien plus robustes car ils réagrègent les données de plusieurs locaux.
Variables du jeu de données EMMA
Six variables socio-économiques sont modélisées. Pour chaque adresse, chaque modalité fait l'objet d'une colonne indiquant le nombre de logements concernés.
| Variable | Modalités |
|---|---|
| Nombre de personnes du ménage | 1 · 2 · 3 · 4 · 5 ou plus |
| Âge de la personne de référence | < 24 ans · 25–39 · 40–54 · 55–64 · 65–79 · 80 ans ou plus |
| Statut d'activité de la personne de référence | CDI · CDD · Non salarié · Retraité · Chômeur · Autre inactif |
| Statut conjugal du ménage | Famille monoparentale · Couple sans enfant · Couple avec enfant(s) |
| Nombre d'enfants dans le ménage | 1 · 2 · 3 ou plus |
| Nombre d'actifs dans le ménage | 1 · 2 · 3 ou plus |
Cas d'usage
Plusieurs usages des données socio-économiques prédites ont été identifiés. La liste ci-dessous n'est pas exhaustive.
En combinant le nombre de personnes des ménages (personnes seules), l'âge de la personne de référence (jeunes ménages), le statut familial (familles monoparentales), le nombre d'actifs et/ou le statut d'activité (ménages inactifs) ou encore le nombre d'enfants (familles nombreuses).
Afin de réaliser des diagnostics, il est possible d'agréger l'ensemble des données socio-économiques sur des périmètres de projet (ZAC, îlot urbain) ou liés à une politique publique (OPAH, PIG, QPV…).
En mobilisant le nombre de personnes des ménages et la typologie de logement (nombre de pièces, surface) pour repérer les situations de surpeuplement ou de sous-occupation.
Caractériser la population dans le périmètre de 500 mètres autour d'une station de transports en commun, ou dans la zone de chalandise d'un commerce ou équipement, pour adapter les offres de service.
Par le couplage des caractéristiques des logements (présence d'ascenseur, distance à un équipement médical) et de l'âge des habitants, pour identifier les situations à risque et prioriser les interventions.
Disponibilité dans les outils
Les données socio-économiques carroyées issues de l'INSEE sont des attributs grand public dans la base IMOPE.
Les données EMMA (profils prédits à l'adresse) sont des attributs sous licence, accessibles dans l'ONB+ via deux modules :
- Le tableau de bord adresse
- L'outil de ciblage et de prospection
Intéressé par les données socio-économiques EMMA pour votre territoire ?
contact@urbs.frOu rendez-vous sur www.urbs.fr/contact