Datamining spatial

Modélisation de variables et applications spatiales
Appréhender, anticiper et mieux décider à l’aide de modèles : l’exemple des magasins Fran + 

 Atelier animé par Zoé Gonnon

Scénario

L’enseigne Fran + est rattachée à la distribution d’hyper-proximité et est actuellement présente sur le département de l’Hérault.

• Dans une volonté d’expansion dans les départements voisins, elle souhaite identifier les zones prospères où s’implanter. Pour cela, Fran+  va identifier les zones problématiques et les zones sur-performantes sur le département de l’Hérault, à l'aide d'un modèle éprouvé pour l’appliquer ensuite sur d’autres territoires. Le modèle validé constitue un outil d'aide à la décision quant à l’implantation de points de vente.

• De la même façon, Fran+ a besoin de qualifier ses points de vente, dans une optique de distribution : il s’agit d’adapter l’offre de produits à la famille du point de vente. L’enseigne doit s’appuyer sur les caractéristiques des magasins ainsi que sur leur environnement socio-démographique pour établir une typologie.

La carte d'étude se base spécifiquement sur 2 départements : l'Hérault, où l'entreprise est historiquement installée et développée, ainsi que le Gard où elle a l'ambition de s'étendre. 
La densité de population est affichée sur notre carte de départ, tout comme nos magasins (logo orange) et ceux de nos concurrents.
Il s'agit de s'interroger sur les facteurs influant sur le taux de pénétration des points de vente Fran+, afin de se développer dans des zones présentant les mêmes caractéristiques, à travers l'utilisation du module Modeler.

Objectif 1 : Créez et réutilisez un modèle spatial

1- 1 Définissez vos variables et étudiez le modèle résultant

 

- Sélectionnez la variable à expliquer (taux de pénétration) ainsi que les variables qu'on juge explicatives (potentiel du magasin, surface, taux de 14-25 ans, taux de familles...).

- Observez  et comprenez les corrélations des variables par rapport à la variable cible.

- Créez un modèle fiable :
          - de qualité : mesure de la proportion d’informations contenues dans la variable cible que les autres variables expliquent;
          - robuste : capacité du modèle a être reproduit sur un autre territoire
Plus le nombre d’objets géographiques et de variables est important et plus le modèle sera de qualité.

-> Dans notre modèle, les indicateurs « concurrents par commune », « tx carte étudiante » et «dist_accès_km » sont les plus représentatifs de la variable cible (30, 11 et 10%, soit 51% de la donnée totale). Cela signifie que les zones sur performantes se situent dans des zones commerciales avec une part importante de jeunes.

1-2 L'analyse comparative : observez la pertinence du modèle à partir des écarts entre le théorique et la réalité

 

- L’analyse comparative permet de valider ou non le modèle.

- Elle crée une thématique sur les IRIS afin de définir ceux pour qui le modèle correspond, ceux qui sous-performent ou sur-performent.

- Il est utile d’étudier le profil des IRIS sur-performants pour des implantations futures.

Notre modèle est validé, puisque sa robustesse et sa qualité sont importantes : il peut être appliqué sur notre territoire ou bien être transposé sur un autre.

 

1-3 L'analyse prédictive : appliquez le modèle sur un autre territoire

 

- Anticiper la performance théorique des points de vente à implanter à l’aide du modèle précédemment créé.

- Cela n’est permis ici que parce que le modèle est de bonne qualité (qualité et robustesse).

-> Les IRIS du Sud du Gard semblent être les plus propices à l’installation de nouveaux points de vente, puisque le taux de pénétration théorique y est important.


Revenir au début  

Les résultats de l'identification de variables pertinentes

La création du modèle basé sur la variable du taux de pénétration permet d'identifier les facteurs et caractéristiques territoriales qui influent le plus sur sa valeur. Nous pouvons en déduire, en tant que magasin d'hyper-proximité, que la présence de concurrents n'est pas limitante, mais qu'elle contribue au contraire à un taux de pénétration élevé, puisqu'elle signifie que les magasins Fran + se situent dans des zones commerciales dynamiques. 

L'analyse comparative met en lumière les IRIS qui s'éloignent du modèle. Il est intéressant d'analyser les zones de sur-performances pour étudier les facteurs qui les influencent.

L'analyse prédictive nous informe de la catégorie à laquelle appartient un magasin à implanter : de cette façon nous pouvons lui attribuer une offre de produits spécifiques en conséquence.


Revenir au début  


Objectif 2 : Mise en place d’une typologie de points de vente

2- 1 Générez une typologie grâce à des variables sociodémographiques et spécifiques au métier 

- A partir d’une variable cible,  créez des ensembles d’objets partageants des caractéristiques homogènes (ici une typologie de points de vente à partir du chiffre d’affaires 2012).

- Sélectionnez les variables qui pourraient expliquer la variable cible (taille magasin, emplacement en centre-ville, périphérie…, caractéristiques sociodémographiques).

- Observez la qualité du modèle et les variables proposées pour chaque catégorie pour estimer le profil du magasin.

 2 - 2 Appliquez la typologie sur des magasins qui ne sont pas encore implantés pour estimer leur famille de rattachement

- Rechargez le modèle préalablement enregistré et appliquez-le sur les magasins d’un autre territoire pour prédire leurs profils.

La typologie comme aide au développement des réseaux

La mise en place d'une typologie permet de répartir les points de vente en familles, dont nous affichons les 5 marqueurs les plus importants, de façon à pouvoir leur affilier un profil de consommateurs et adapter l'offre de produits à chaque type de magasin.

Cette typologie peut être ré-appliquée sur des points de vente non-existants, en intégrant leurs données métier et les données socio-démographiques du territoire d'implantation.

 

Modeler, pour quelle utilisation ?

Modéliser, c’est hiérarchiser toutes les variables sélectionnées en indiquant pour chacune d’entre elles sa contribution à la variable cible
Segmenter revient à créer des groupes aux caractéristiques homogènes à partir d’une variable cible.

Le module Modeler for Geoconcept, nécessaire pour cette étude, permet de comprendre, anticiper et aider à la décision en s’appuyant sur la construction de modèles basés sur des variables métiers et sociodémographiques.

Revenir au début