Deux enseignants chercheurs de l’Ecole Supérieur d’Ingénieurs de Léonard de Vinci (ESILV) sont venus parler de leurs travaux sur l’utilisation du big data appliqué au secteur du tourisme dans le cadre des conférences Person of Interest. Gaël Chareyron travaille sur les liens entre réseaux sociaux, big data et tourisme en développant des outils d’analyse et de data mining. Les thèmes de recherche de Jérôme Da-Rugna sont le big data et le traitement des images. Ils collaborent avec l’équipe interdisciplinaire de recherches sur le tourisme (EIREST) de l’Université de Paris 1 Panthéon-Sorbonne.
J’ai trouvé cette conférence intéressante car on parle beaucoup de big data et de l’énorme potentiel des millions de données, mais cela reste bien souvent très théorique. Les deux chercheurs expliquent leurs pistes d’exploration de l’utilisation de la big data avec de multiples exemples concrets.
Quelles sont les données actuellement disponibles pour comprendre un secteur comme le tourisme ? Les statistiques sont une première source d’information (données de fréquentation des gares, des aéroports, données issues des douanes) . Ce sont des données éparpillées. Une étape de recherche, d’analyse et de synthèse sont nécessaires pour les exploiter. Les études de marché sont une autre source d’information. Mais une étude de marché concerne souvent une problématique à un moment précis et les résultats d’études ne sont forcément librement partagés.
Utiliser les données des réseaux sociaux pour analyser le tourisme ?
Que pourrait-on savoir en exploitant les données disponibles sur internet ? Serait-il possible de savoir comment les gens circulent ? Comment ils sont venus sur ce lieu ? Ce qui les a motivé ? Si ils sont satisfaits ? C’est ce que cette équipe de chercheurs tente de faire.
Leurs sources de données sont diverses. Ils utilisent les réseaux sociaux Instagram, ainsi que les sites de photos comme flickr ou Panoramio. La plateforme d’avis Tripadvisor est bien évidemment une mine d’or. Et il est souvent possible de savoir quand et où une photo a été prise, et parfois par qui (sexe, âge, pays d’origine). En effet, l’intérêt ne réside pas seulement dans le contenu de ce qui est publié (la photo, le commentaire) mais également dans les méta-données qui l’accompagnent. L’équipe de chercheurs travaille également sur l’utilisation des données provenant d’autres sites comme Airbnb ou hotels.com.
Des exemples concrets d’utilisation de la data
Connaître le profil des touristes
La Suisse publie des statistiques précises de visite de chaque canton (nombre de touristes, pays d’origine, date). En utilisant les données issues de flickr, les chercheurs de l’ESILV ont réussi à obtenir des résultats corrélés à ces statistiques officielles. Ils ont ainsi pu identifier les zones fréquentées par les touristes français, par les allemands et les anglo-saxons.
Ils ont également mené ce genre d’analyse sur la France avec les données de Tripadvisor. Connaître la nationalité des personnes qui postent sur les réseaux permet ainsi d’identifier leur profil. Il est donc possible de faire ce genre d’analyse en fonction d’autres critères qui sont comme l’âge par exemple. Si vous vous demandez où vont les jeunes en vacances, les familles avec enfants ou les séniors, les réseaux sociaux sont une véritable source d’insights.
Comprendre les parcours de visite à Paris
En analysant la densité des photos sur Paris, ils ont pu identifier les zones les plus touristiques de la ville. Bien sûr, on retrouve la Tour Eiffel, les Champs Elysées, le centre historique de Paris. Mais en allant un peu loin, ils ont pu constater que la zone de la Tour Eiffel ne ressemblait pas à celle des Champs Elysées. Les touristes restent sur les Champs Elysées et s’aventurent assez peu autour de l’avenue. En revanche, ce n’est pas le cas autour de la Tour Eiffel. Il y a beaucoup plus de diffusion autour de ce site, les touristes s’aventurent sur une zone plus large aux alentours de la Tour Eiffel.
Connaître le parcours de visite d’un site touristique
L’équipe de chercheurs a également fait des analyses sur des zones beaucoup plus réduites. Ils ont utilisé les traces laissées par 5000 utilisateurs sur le parc du château de Versailles. En effet, les visiteurs font des photos lorsqu’ils visitent le parc et les postent sur Flickr et Instragram. Ils ont pu constater que de nombreux visiteurs suivent le chemin proposé par la brochure, surtout les touristes étrangers. Les visiteurs français ont eux plus tendance à déambuler dans le parc sans suivre le plan proposé par la brochure. Cela confirmerait-il que les Français ont une tendance à chercher de meilleures solutions que celles proposées de prime abord (une façon gentille de dire qu’ils sont un peu rebelles) ? Je ne sais pas, les chercheurs ne se sont pas aventurés à une explication sur ce point.
Une histoire qui ne fait que commencer
Les chercheurs donnent de nombreux autres exemples : l’analyse de ce qui se mange à Barcelone via les photos de repas sur Instagram, l’analyse des flux de circulation des touristes en Ile de France, la visite des lieux de mémoire, l’analyse des récits de la visite du Mont Saint Michel, l’analyse de la saisonnalité du tourisme à Paris.
Tous ces exemples montrent le potentiel encore inexploité de l’utilisation de la donnée dans la compréhension du consommateur et des clients. Nous n’en sommes qu’au début !
Si vous voulez voir la conférence en entier, elle est disponible sur youtube.