Dans le cadre de ses travaux partenariaux sur la qualification des données géographiques, le Cerema a lancé une enquête auprès des producteurs et utilisateurs de données. L’objectif : connaître les pratiques en cours et les besoins en matière de qualification des données, pour aider à la mise en pratique des éléments méthodologiques récemment publiés.
Cette enquête, relayée sur georezo et le site du CEREMA, a suscité 237 réponses. Quelques extraits et grandes idées vous sont proposés dans cette synthèse, et vous pourrez retrouver les résultats détaillés en fin de page.
La qualité : un enjeu fort et des pratiques répandues
Si la qualité des données est (heureusement !) vue comme une information nécessaire à connaître avant d’utiliser des données, ce sont les critères de précision de position et de précision thématique qui semblent les plus importants à examiner.
La qualité en tant que producteur…
Du côté des pratiques de production et diffusion des données, on trouve peu de surprises dans les réponses. On peut néanmoins noter plusieurs points :
-
dans une large part, les répondants estiment avoir une bonne connaissance de la qualité des données qu’ils diffusent ;
-
de même, ils se sentent responsables de la qualité de ces données ;
-
presque 3/4 d’entre eux effectuent un rapportage de la qualité des données qu’ils produisent et/ou diffusent (mais peu utilisent un logiciel dédié) ;
-
la correction des données de mauvaise qualité est également une pratique courante.
…et en tant qu’utilisateur
En tant qu’utilisateur, la qualité des données constitue un critère de choix : presque 3/4 des répondants affirment avoir été amenés à choisir une source de données en fonction d’éléments relatifs à la notion de qualité.
Malgré cela, l’utilisation de données de « mauvaise qualité » reste une pratique courante, sans doute lorsque les alternatives sont limitées, ou lorsque l’usage prévu ne nécessite pas une qualité importante.
Enjeux et besoins
Deux types d’enjeux liés à la qualité des données avaient été ciblés dans l’enquête :
-
le lien avec l’OpenData : la qualité des données ouvertes est jugée très variable et dans tous les cas, le manque d’information sur cette qualité constitue un frein à la réutilisation ;
-
l’intérêt des métadonnées : selon les répondants, elles ne suffisent pas à estimer la qualité des données actuellement. L’explication : certains pointent le manque ou le mauvais remplissage des métadonnées, qui peuvent pourtant contenir des champs « qualité », quand d’autres proposent de trouver une autre méthode de rapportage de la qualité.
L’objet de l’enquête était également de percevoir les besoins en matière d’accompagnement :
-
éléments méthodologiques, automatisation, aide au catalogage… les besoins sont pluriels ;
-
les deux tiers des répondants sont intéressés par la mise en place d’une formation sur le sujet.
Accéder aux résultats détaillés
Les résultats détaillés de l’enquête sont téléchargeables ci-dessous. Vous trouverez une infographie permettant d’accéder aux données de façon graphique, et également le tableau des résultats bruts. Ces résultats ont été anonymisés.