DATAtourisme : de l’huile dans les rouages de la donnée touristique
Démarche initiée en 2015, DATAtourisme est aujourd’hui une plateforme nationale de partage de données touristiques autant qu’une communauté d’acteurs engagés pour la diffusion augmentée d’une donnée de qualité. Entretien avec une de ses chevilles ouvrières, Pascale Vinot, en charge de ce projet partenarial à Tourisme & Territoires.
- Quel est le constat à l’origine de DATAtourisme ?
La réflexion a commencé en 2014. Un groupe de travail au sein de Tourisme & Territoires (ex Rn2d) travaillait sur le sujet du « e-tourisme » et de la promotion des destinations sur Internet. Ce groupe avait pour objectif de réfléchir à la diffusion des informations collectées quotidiennement sur le terrain et stockées dans les bases de données appelées « Systèmes d’information touristique », tout en appréhendant les questions liées à l’open data (l’ouverture des données publiques ndlr).
Sur le premier point, la multiplicité et l’hétérogénéité des bases locales, dont le périmètre mais aussi les technologies et formats diffèrent d’un territoire à l’autre, ont conduit au fil du temps à des difficultés dans l’interaction et la compatibilité des données entre elles à l’échelle nationale. Conséquence ? La réutilisation des données était trop contraignante pour permettre une large diffusion des informations. Pour développer des applications sur le territoire national, les opérateurs privés devaient faire face à plusieurs dizaines d’interlocuteurs différents et générer des flux souvent incompatibles entre eux. Une barrière technique et chronophage qui les incitait à circonscrire leur activité à un périmètre plus restreint ou à faire appel à d’autres sources de données.
Et sur le deuxième sujet, l’open data commençait à se développer déjà en 2015. Il fallait trouver une solution permettant aux territoires de répondre techniquement à ce besoin nouveau. Ainsi est née l’idée de créer une plateforme nationale d’agrégation et de mise à disposition des données touristiques.
- Comment DATAtourisme répond-t-il au besoin de réconcilier la donnée ?
Nous nous sommes lancés dans une logique de guichet unique : une plateforme qui rassemble, norme et rende compatibles les données entre elles, à la place des opérateurs. Le besoin de fédérer autour de ce projet était évident. Un groupe de travail impliquant au maximum l’écosystème de la donnée touristique a alors été constitué, piloté par Tourisme & Territoires. Producteurs publics de données touristiques et utilisateurs privés se sont réunis pour construire ensemble le projet. Le besoin de financements pour le développer a poussé vers un rapprochement avec l’État. La Direction générale des entreprises (DGE) a alors proposé un double portage du projet, pour candidater au dispositif Programme d’investissement d’avenir (PIA). Le projet a été lauréat du PIA en 2015, ce qui a permis de lancer le développement de la plateforme et le chantier de normalisation des données.
- Existait-il des retours d’expérience étrangers en la matière ?
Nous avons rapidement constaté le manque, voire l’absence, d’initiatives comparables à l’international. Au Québec ou en Irlande, il existe des exemples intéressants en termes d’ouverture de données mais nous voulions aller plus loin que la simple mise à disposition des bases de données existantes en travaillant aussi sur la normalisation des celles-ci. La France est donc un pays plutôt précurseur en la matière. Nous sommes d’ailleurs régulièrement interrogés par des interlocuteurs européens qui veulent en savoir plus sur DATAtourisme.
- Où en est DATAtourisme aujourd’hui ?
Aujourd’hui, DATAtourisme comprend deux volets. Le premier est une plateforme qui agrège et met à disposition les données touristiques partagées. Cet outil sur-mesure récupère les flux des 40 systèmes pré-existants et les adapte, puis les met à disposition de tous selon les principes de l’open data. A partir de données hétérogènes à l’entrée, nous mettons à disposition des données homogènes en sortie, grâce notamment à un système de tables de correspondances. Une « ontologie du tourisme » a été spécifiquement développée à cet effet. Il s’agit d’une sorte de grammaire et d’un vocabulaire communs permettant de décrire la donnée et de la catégoriser de façon organisée et hiérarchique. Le dictionnaire est mis à jour une fois par an pour s’adapter au mieux à la réalité du secteur.
Le deuxième volet concerne l’animation d’une communauté autour de la qualité de la donnée, la méthode de production et l’information touristique. Tourisme & Territoires anime un « Club de producteurs » et un groupe technique plus restreint, sur la base de réunions régulières avec des représentants d’Offices de Tourisme, de Comités départementaux du tourisme et de Comités régionaux du tourisme. En parallèle, un travail est mené vers la communauté des réutilisateurs de données. Ce travail permet notamment de mieux comprendre les besoins des entreprises et start-up et de les sensibiliser à l’écosystème de production de la donnée touristique.
- Concrètement, quel est impact sur la gestion des données touristiques par les producteurs ?
DATAtourisme permet de mettre en place un cercle vertueux. Alors que les données touristiques étaient jusqu’ici peu exposées, aujourd’hui, les 4 500 utilisateurs de la plateforme s’y intéressent en vue de les diffuser sur leurs propres sites internet et applications. Cette perspective de diffusion multicanale des données démultiplie le besoin de fiabilité et de qualité des données et facilite aussi la détection d’éventuelles erreurs de saisie.
Au-delà de cet aspect, l’impact de DATAtourisme sur la gestion de la donnée par le producteur est peu contraignant. DATAtourisme implique un paramétrage de départ entre la base locale et la plateforme. Puis le partage se fait chaque jour par flux automatisés sans incidence sur le travail du producteur au quotidien. L’animation de la communauté vise aussi à accompagner les producteurs de données dans la hiérarchie des priorités. Par exemple, sur le premier semestre 2019, l’accent est mis sur la donnée touristique liée au vélo et la donnée traduite en anglais.
- Pouvez-vous nous en dire plus sur la donnée touristique liée au vélo ?
De nombreuses données utiles aux touristes à vélo sont recensées dans les bases de données locales : itinéraires, services pratiques, mais aussi tous les prestataires porteurs de la marque Accueil Vélo. Nous avons récemment enrichi le dictionnaire de l’ontologie DATAtourisme pour permettre la publication de toutes ces données sur la plateforme nationale et donner ainsi l’opportunité aux start-up et autres diffuseurs de créer des sites et applications numériques dédiées au tourisme à vélo. France Vélo Tourisme est le premier exemple concret de réutilisation de ces données : depuis quelques semaines, l’association puise dans DATAtourisme pour alimenter son nouveau site internet.
- Quelle est la gouvernance et le modèle économique de DATAtourisme ?
La gouvernance de DATAtourisme est collective. Elle est composée d’un comité de pilotage réunissant la DGE et Tourisme & Territoires. Il est complété par un comité d’orientation auquel participent Etalab, OTF et Destination Région pour le volet stratégique. Le « Club de producteurs » apporte sa vision du terrain sur les sujets à aborder. Les décisions sont donc prises collectivement avec une implication plus forte au quotidien de la DGE et de Tourisme & Territoires qui portent l’animation de la démarche.
En termes budgétaire, le projet a été financé par le PIA au lancement avec un cofinancement de l’Etat et de Tourisme & Territoires. En 2019, l’Etat prend en charge les dépenses courantes et Tourisme & Territoires met à disposition des ressources humaines. Une étude sur différentes possibilités de modèle économique est en cours, mais le caractère ouvert des données est un frein à la diversification des sources de financement.
- Quelles sont les prochaines étapes pour DATAtourisme ?
L’objectif principal est de consolider le projet, maintenant qu’il est lancé, afin de couvrir l’ensemble du territoire. À ce jour, 85 départements participent à DATAtourisme, avec un nombre total de 288 000 données sur la plateforme. Nous avons une marge de progression sur le remplissage de la plateforme, les territoires ont encore de nombreuses données à publier.
Des évolutions ? Permettre à plusieurs fournisseurs de données pour un même périmètre de partager leurs données en évitant les doublons. Cela demande une réponse technique. Autre piste ? Diffuser des données dans d’autres langues que le français et l’anglais. L’animation des communautés est aussi très utile mais chronophage. La consolidation d’une équipe dédiée pourrait à terme permettre de renforcer certaines actions de DATAtourisme, dont ce volet animation.
Propos recueillis par Agathe Daudibon