Open Data Informations Travaux (2/2): vers un standard ouvert

Posted by Olivier Marcel on Dec 5, 2019 11:38:00 AM
Olivier Marcel
Find me on:

 

A stem demonstrator at Craft Lake City presented his electrical contraptions.

Photo by John Barkiple on Unsplash

 

            La complexité est le mot récurrent dans les discussions sur les données de travaux. Celle-ci tient d'abord de la richesse sémantique des métiers que ces données décrivent, et d'autre part de la pluralité des applications qu'elles permettent. En effet, dans la dernière décennie, la prise en compte de l'information sur les travaux publics a été tour à tour formulée selon des problématiques de risque (anti-endommagement), d'économie (coordination), de gaspillage (mutualisation), de gêne aux usagers (travaux perturbants) ou de transparence (open data).

 

            Chacune de ces facettes répond à des besoins et des logiques d'acteurs qui peineront à s'aligner tant que l'intérêt économique d'une convergence n'est clairement démontrée (Benyayer et Chignard, 2015). À cela s’ajoute la multiplicité des parties-prenantes, publiques et privées. En 2019, la base de donnée des déclarations de travaux de la ville de Paris recensait pas moins de 138 organisations ayant chacune un certain degré d’autonomie dans la divulgation de ses programmes de travaux. L’information étant distribuée à travers différentes corporations et hiérarchies métiers, les acteurs des travaux publics évoluent souvent avec une connaissance incomplète de leur territoire d’action, tout en étant dépendant des actions des autres.

 

            Une des conséquences de cette complexité accablante est qu'à ce jour et à l'échelle nationale, les informations travaux n'ont aucune source centralisée ou standardisée. Or, “dans un contexte de territorialisation des données ouvertes et de coexistence entre des pratiques de gestion des données diverses, l’absence de normalisation freine l’interopérabilité, la garantie de la qualité et la possibilité de diffuser des jeux de données universellement utilisables” (Lehmans, 2018). Ainsi, les difficultés rencontrées par les producteurs de donnée, notamment pointées dans le premier volet de cette série d'articles sur l'open data travaux, découlent directement d'une situation dans laquelle la saisie de chantiers est redondée à grand-peine par les petites mains de collectivités ou d'organisations volontaires. Cela génère en outre des difficultés pour les réutilisateurs qui doivent faire avec des jeux de données hétérogènes, éclatés dans un éventail de canaux de distribution, et dont l'ouverture et la couverture sont encore trop partielles.

 

Retrouvez la première partie de l'article

 

            Ce deuxième article aborde l'information travaux par l'angle de ses usages, avec en filigrane la recherche d'une méthodologie permettant de converger vers un standard ouvert. Après avoir décrit certains écueils liés à la modélisation de la donnée travaux, il s'agira d'envisager les conditions d'une interopérabilité large du schéma Informations Travaux, dont une première version est d'ores et déjà mise à disposition sur la plate-forme schema.data.gouv.

 

 

Construire du commun

 

            Le projet de METIS est né d'une expertise de terrain et d'un contexte métier spécifique : celui de l'Aménagement Numérique du Territoire et du déploiement de la fibre en France, avec ses acteurs, ses pratiques, ses méthodologies de travail, ses contraintes techniques et ses formats de données (par exemple Gr@ceTHD, le géostandard Covadis). Or, la question de la mutualisation des travaux (application GOTMI), puis celle plus généraliste de l'information travaux (guichet-travaux) procède d'une montée en généralité des contraintes et des besoins des gestionnaires de travaux de toutes natures. Quelque soit le statut juridique (public ou privé), le contexte géographique (urbain ou rural), et toutes catégories confondues, l'information sur les travaux sur le domaine public est potentiellement un commun souhaitable.

 

La dimension transversale de l'information travaux est donc sa principale richesse : plus le schéma sera en mesure d'accueillir des informations diversifiées, plus les externalités positives valorisant les infrastructures au service des citoyens seront nombreuses.

 

            Cette transversalité constitue cependant une difficulté majeure. Comment traduire l'hétérogénéité des pratiques des opérateurs dans un ensemble de règles communes ? Par exemple, comment fédérer un chargé de déploiement télécom et une direction des voiries ? La question se complexifie davantage en prenant en compte l'hétérogénéité horizontale des opérateurs, de l'urbain au rural.

 

            Afin d'identifier les dénominateurs communs entre des acteurs hétérogènes, il est nécessaire d'éplucher la littérature grise sur le sujet (normes, textes de loi) et de faire l'inventaire des normes techniques et des formats de données spécifiques aux différentes familles de travaux : électricité, télécommunication, chauffage, eau, assainissement, gaz, voirie, aménagement urbain. Nous ne pouvons ignorer le décalage entre les textes normatifs et la réalité du terrain, souvent plus soucieuse de pratiques locales implicites que de normes englobantes. Néanmoins, la recherche de commun par des attributs normés, comme par exemple les normes NFP de catégorisation des travaux ou d'interdistance minimale, semble décisive. La prise en compte des normes, comme l'utilisation de données pivots, garantie un premier niveau de généricité du schéma. Un autre exemple de référentiel clé est la définition d'un cycle de vie générique d'un chantier planifiable : l’intention, l’instruction, l’intervention, jusqu’à la réalisation. Les points de convergences sont nombreux et justifient le projet d'un schéma de donnée transversal.

 

Processus chantier - Datacity 2019
Processus chantiers de la Ville de Paris et ses concessionnaires. Schéma réalisé dans le cadre du challenge Datacity 2019. Réalisation NS 2019.

 

 

Convergence des standards

 

            Éviter la redondance des standards est la toute première des prescriptions de bonnes pratiques adressées par la communauté open data française aux développeurs de standards (voir le document collaboratif Produire un standard open data en 2019 : grands principes et jalons). Cette recommandation est à mettre directement en lien avec la seconde : évaluer les cas d'usages de la donnée. En effet, c'est parce que la revue des usages n'a pas été menée à bout que les formats de donnée peuvent se restreindre à des corporations métiers ou des entités géographiques, conduisant au morcellement décrit précédemment. C'est précisément ce qui semble avoir eu lieu avec l'information travaux.

 

Les silos de l'information travaux
Les silos de l'information travaux. Réalisation : OM 2019.

 

            Pour répondre aux obligations de l'article L. 49, on a orienté les producteurs d'informations sur un format générique de déclaration via une interface web TAPIR. Pour encadrer les échanges de données dans le cadre des DT-DICT, le CNIG pousse désormais la version 1 du géostandard vectoriel StaR-DT. Pour garantir la sécurité des infrastructures, l'INERIS invite à renseigner son propre schéma téléservice. Les données sur le trafic routier sont plus préoccupantes : malgré l'existence d'un standard européen (DATEX II) et d'un standard ouvert (OPEN511), on constate de plus en plus de collectivités et de services publiques confier leurs données aux GAFA (Waze en l'occurrence), leurs modèles devenant standards de facto. De l'autre côté du spectre, l'Open Contracting Partnership met à disposition un standard ouvert et international, CoST Infrastructure Data Standard, sensé garantir la transparence dans les travaux publics, mais dont l'outillage applicatif freine pour l'heure l'adoption en France. Il existe enfin des usages pour lesquels l'effort de standardisation n'a pas (encore) abouti. C'est le cas par exemple de la mise en relation des maîtres d'ouvrages, pour laquelle les développeurs de logiciels construisent des modèles de données ad hoc (METIS a été confronté à ce problème avec l'application GOTMI). Autre exemple, l'instruction de voirie ou la Redevance d'Occupation du Domaine Public, dont la dématérialisation pourrait occasionner la mise en place de nouveaux formats spécifiques et compliquer davantage leur compatibilité.

 

La saisie de plusieurs données pour un seul et même chantier
La saisie de plusieurs données pour un seul et même chantier. Réalisation : NS 2019

 

Ainsi, chaque usage de cette même famille d'informations travaux suscite actuellement un format distinct et bien souvent incompatible avec les autres, ce qui génère mécaniquement des silos informationnels.

 

            Notons que cette énumération ne prétend pas à l'exhaustivité dans les usages que permet l'information travaux. Dès lors, comment libérer les informations générées dans ces silos ?

 

 

“Dites-le-nous une fois !”

 

            Le recours à des stratégies open data a contribué à refaçonner le cycle de vie de la donnée, invitant les producteurs à "prendre en considération, dès le moment de la collecte, la possibilité de réutilisation, sans que celle-ci soit clairement définie à l’avance" (Lehmans, 2018). À ces enjeux de découvrabilité et de réutilisation de la donnée produite s'ajoute celui de l'interopérabilité effective des jeux de données constitués. En effet, la plupart des collectivités et des organisations qui consacrent du temps et de l'énergie à produire ou centraliser la donnée travaux ont un intérêt fort à ce que celle-ci puisse s'insérer efficacement dans plusieurs des usages identifiés précédemment.

 

Ainsi, le “Dites-le-nous une fois !”, slogan initialement inventé pour la plate-forme de modernisation de l'action publique, est plus que jamais d'actualité pour la production de la donnée de valorisation des infrastructures.

 

 

Le schéma Informations Travaux comme nœud d'interopérabilité
Le schéma Informations Travaux comme nœud d'interopérabilité. Réalisation : OM 2019

 

            Pour casser les silos de l'information travaux, le schéma Information Travaux devra s'adapter aux usages les plus critiques, ouvrir de nouvelles pistes d'interopérabilité, démontrer son efficacité sur le terrain et dans les applications qu'il pourra susciter. Ces évolutions présentent deux enjeux majeurs : maintenir la simplicité et ouvrir la gouvernance du schéma.

 

 

Un devoir de simplicité

 

            Actuellement, les géostandards portant sur les infrastructures de réseaux proposent essentiellement une modélisation de type patrimoniale : il s'agit de décrire l'existant à travers des attributs qui se rapproche au plus près des spécificités métiers. Les problématiques de la coopération ou de transparence nécessitent une modélisation orientée sur le projet plutôt que sur l'existant. En outre, elles génèrent non pas des données statiques mais des flux dynamiques, sujets à modifications successives. De fait, la richesse sémantique et attributaire des modèles patrimoniaux est moins critique que la facilité de saisie et d'actualisation.

 

Cela amène à réfléchir à la définition d'un modèle minimal, allégeant le plus possible la charge laborieuse de la saisie des projets qui reste l'obstacle majeur à une participation massive.

 

            Dans sa première version, le schéma Information Travaux ne requiert pas plus d'une dizaine d'attributs et peut être ouvert et édité via des outils open-source (QGIS). L'enjeu est donc de maintenir cette souplesse tout en autorisant le branchement sur l'éventail le plus large possible d'usages.

 

 

L'open data, une méthode de conduite du changement

 

            En initiant des consultations sous forme de webinaires, en organisant des ateliers de travail avec des experts et parties-prenantes de la valorisation des infrastructures et en publiant nos avancées sur une plate-forme ouverte permettant le suivi des améliorations successives, METIS s'est engagé dans un travail collaboratif qui vise à encourager et accélérer la création, le maintien et l’exploitation des données ouvertes. Ainsi, si le schéma Information Travaux ne pourra pas nécessairement être interopérable avec tout et tout de suite, nous comptons sur les synergies que favorise cette méthodologie de l'open data pour orienter les développements futurs et identifier les ponts stratégiques. Parmi ces partenariats, on note ETALAB avec par exemple son Point d’Accès National aux données de transport, le GT OpenData de l'AFIGEO, ou encore l'association Open Data France qui porte l'initiative du Socle Commun des Données Locales. Plus particulièrement, il s'agit maintenant d'évaluer les bénéfices du standard Informations Travaux au regard des différents cas d’usages et de définir les priorités dans l'outillage applicatif et le développement d'API ouvertes permettant d'importer ou convertir les informations vers les formats reconnus nationalement (tels que StaR-DT) ou les standards ouverts internationaux (tels que CoST IDS).

 

            Au final, si “le succès d'un standard est déterminé par le marché”, comme le propose l'un des 5 principes d'Open Stand pour le développement de standards ouvert, il est essentiel que les fournisseurs de logiciels puissent déployer ce standard dans le quotidien des parties-prenantes de l'information travaux. À cet égard, l'inauguration prochaine du guichet-travaux le 11 décembre 2019 apporte la promesse d'une interface libre de saisie et de gestion d'informations travaux qui s'inscrit dans la continuité de cette méthodologie open data.

 

Visitez le Guichet-travaux

 

Olivier Marcel, docteur en géographie, ingénieur R&D GéoData à METIS depuis 2018.

 

RÉFÉRENCES