Mots clés
Conseil 20217255 - Séance du 17/02/2022
La Commission d'accès aux documents administratifs a examiné, dans sa séance du 13 janvier 2022, votre demande de conseil relative à la conformité de la mise en open data sur data.gouv.fr., des données individuelles suivantes issues des enquêtes NOYADES, entre 2003 et 2021, relatives aux noyades accidentelles et pour les variables suivantes :
1) département d'intervention ;
2) date et tranche horaire d'intervention ;
3) sexe de la victime ;
4) âge de la victime, par tranche d'âge (5 ans) ;
5) résidence à l'étranger de la victime (oui/non) ;
6) lieu de noyade ;
7) piscine enterrée/hors-sol ;
8) zone de baignade surveillée (oui/non) ;
9) stade de la noyade ;
10) activité pratiquée lors de la noyade ;
11) décès (oui/non) ;
12) prise en charge hospitalière (oui/non).
La commission vous rappelle, à titre liminaire, que, saisie d’une demande de communication des données brutes ayant permis d'établir les « enquêtes Noyades », elle a émis un avis favorable, n° 20183408 du 20 décembre 2018, sous une double réserve tenant, d’une part, aux informations médicales au sens des articles L1110-4 et L1111-7 du code de la santé publique qui ne sont communicables qu’aux professionnels de santé intervenus dans la prise en charge d'une victime et, dans le cas d'une personne décédée, à ses ayants droit, dans la mesure où ces informations leur sont nécessaires pour leur permettre de connaître les causes de la mort, défendre la mémoire du défunt ou faire valoir leurs droits, sauf volonté contraire opposée par la personne avant son décès, et, d’autre part, des informations susceptibles de porter atteinte à la vie privée conformément à l'article L311-6 du code des relations entre le public et l'administration.
Elle a précisé, en ce sens, estimer que l'extrait sollicité était « communicable après occultation préalable de toutes les données relatives aux victimes, ce qui comprend toute information permettant d'identifier directement ou indirectement une victime, notamment sa date de naissance mais également les circonstances et le lieu de la noyade ainsi que toute donnée personnelle. En outre la commission considère que la mention simultanée du code postal de la commune où est survenue la noyade, la date et l'horaire de celle-ci, doit être évitée, ces informations étant susceptibles d'être rapprochées ».
La commission vous rappelle toutefois qu’aux termes de l’article L312-1-2 du code des relations entre le public et l’administration : « Sauf dispositions législatives ou réglementaires contraires, lorsque les documents et données mentionnés aux articles L312-1 ou L312-1-1 comportent des mentions entrant dans le champ d'application des articles L311-5 ou L311-6, ils ne peuvent être rendus publics qu'après avoir fait l'objet d'un traitement permettant d'occulter ces mentions. Sauf dispositions législatives contraires ou si les personnes intéressées ont donné leur accord, lorsque les documents et les données mentionnés aux articles L312-1 ou L312-1-1 comportent des données à caractère personnel, ils ne peuvent être rendus publics qu'après avoir fait l'objet d'un traitement permettant de rendre impossible l'identification de ces personnes. Une liste des catégories de documents pouvant être rendus publics sans avoir fait l'objet du traitement susmentionné est fixée par décret pris après avis motivé et publié de la Commission nationale de l'informatique et des libertés. (...) ».
La commission en déduit que, s’il peut être procédé à la publication d’un document administratif dès lors que son contenu respecte les secrets protégés par les articles L311-5 et L311-6 du code des relations entre le public et l’administration, ce document doit, en outre, satisfaire aux conditions posées au deuxième alinéa de l’article L312-1-2 s’agissant de la protection des données à caractère personnel, s’il comporte des données de cette nature. Il résulte de ces dispositions que des documents comportant des données personnelles ne peuvent être publiés en ligne que s'ils ont fait l'objet d'un traitement permettant de rendre impossible l'identification de ces personnes, ou dans les trois hypothèses suivantes : - si une disposition législative autorise une telle publication sans anonymisation ; - si les personnes intéressées ont donné leur accord ; - si les documents figurent dans la liste prévue par l'article D312-1-3 du code des relations entre le public et l'administration.
S'agissant de données à caractère médical, la commission a d’ailleurs rappelé dans une précédente demande de conseil (conseil n° 20133264 du 10 octobre 2013), qu’une vigilance particulière s'impose en vue de garantir l'anonymat parfait des intéressés dans l'hypothèse d'une communication à des tiers d'éléments qui ne permettent pas a priori d'identifier les personnes concernées, hors des cas expressément prévus par la loi.
La commission relève d’ailleurs qu’aux termes de l’article 68 de la loi n° 78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, modifiée : « Nonobstant les règles relatives au secret professionnel, les membres des professions de santé peuvent transmettre au responsable d'un traitement de données autorisé en application de l'article 66 les données à caractère personnel qu'ils détiennent. / Lorsque ces données permettent l'identification des personnes, leur transmission doit être effectuée dans des conditions de nature à garantir leur confidentialité. La Commission nationale de l'informatique et des libertés peut adopter des recommandations ou des référentiels sur les procédés techniques à mettre en œuvre. / Lorsque le résultat du traitement de données est rendu public, l'identification directe ou indirecte des personnes concernées doit être impossible. / (…) » et qu’aux termes de l’article L1461-2 du code de la santé publique : « Les données du système national des données de santé qui font l'objet d'une mise à la disposition du public sont traitées pour prendre la forme de statistiques agrégées ou de données individuelles constituées de telle sorte que l'identification, directe ou indirecte, des personnes concernées y est impossible. Ces données sont mises à disposition gratuitement. La réutilisation de ces données ne peut avoir ni pour objet ni pour effet d'identifier les personnes concernées. / (…) ».
En l’espèce, la commission note que la publication en ligne des données en cause répond à un projet de la direction générale de la santé de « hackathon noyades » visant à encourager des projets innovants d’analyse de données permettant d’améliorer la prévention des noyades. La commission relève à cet égard que des données de nature relativement similaire sont diffusées en ce qui concerne les accidents corporels de la circulation routière.
La commission constate que le document intitulé « Évaluation de l’anonymat de données mises à disposition du public » fait état d’un risque « négligeable » de rupture de l’anonymat et, par suite, d’atteinte à la vie privée de la victime ou de son entourage ou au secret médical, compte tenu, d’une part, de la « limitation de la précision de certaines variables » et, d’autre part, des « efforts disproportionnés » requis pour cela.
Toutefois, ce document ne montre pas que le risque de ré-identification soit sérieusement écarté, qu’il s’agisse du risque d’individualisation, de corrélation ou encore d’inférence. Il admet, en effet, pour le premier, que la « majorité des lignes présente des caractéristiques spécifiques : un seul cas de telles tranches d’âge, dans tel département voire tel jour, dans telles circonstances » et que « ce risque serait accru dans les département où peu de noyades sont déclarés », pour le deuxième qu’« une personne pourrait recouper le fichier des enquêtes NOYADES avec le fichier des décès de l’Insee et connaître ainsi la cause de décès et les circonstances du décès d’une personne » dans certaines hypothèses, et, pour le troisième, que « Les personnes qui connaissent la victime pourraient éventuellement découvrir des informations sur les circonstances de sa noyade. ». Il ajoute d’ailleurs que « les noyades font l’objet de communications par la presse locale ».
La commission en déduit que les données en cause ne peuvent donc pas être regardées comme ayant fait l'objet d'un « traitement permettant de rendre impossible » l'identification des personnes concernées et demeurent en l’état des données à caractère personnel, qui ne peuvent, en application des dispositions du 2° de l'article L312-1-2 du code des relations entre le public et l'administration précitées, être publiées que si une disposition législative le prévoit, si les personnes concernées ont donné leur accord ou si la base de données figure au nombre des catégories de documents définies à l'article D312-1-3 du même code pouvant être publiés sans avoir fait l'objet au préalable d'un processus d'anonymisation.
La commission constate cependant qu'il n'existe aucune disposition législative en ce sens, que l'accord des personnes concernées est matériellement impossible à recueillir a posteriori et que la base de données ne peut être rattachée à une des catégories définies par l'article D312-1-3 du code des relations entre le public et l'administration.
La commission ne peut donc que vous conseiller, en l'état de la réglementation et compte tenu des variables proposées à la publication, de ne pas mettre en ligne l'extrait de la base Noyades que vous lui avez présenté.
La commission, sensible néanmoins à la démarche entreprise de prévention des noyades, précise que le risque de rupture de l’anonymat résulte, d’une part, du faible nombre de données en cause (le bilan préliminaire de l’enquête Noyades 2021 fait état de 1 119 noyades accidentelles recensées entre le 1er juin et le 31 août, dont 250 suivies de décès) et, d’autre part, de la relative précision des variables de lieu et de temps.
Elle relève votre nécessité de conserver la date et la tranche horaire afin de pouvoir faire des appariements avec les données de Météo France et indique, dès lors, qu’une attention particulière pourrait être apportée à une redéfinition de la variable de lieu. Elle note, à l’inverse par comparaison, s’agissant de la publication des données beaucoup plus nombreuses des accidents corporels de la circulation routière, à la suite de son avis n° 20114970 du 22 décembre 2011, que si la variable de lieu peut s’avérer précise, celle de temps ne l’est pas, comportant l’année et l’heure mais pas le jour.
La commission vous rappelle enfin qu'elle est disponible pour accompagner l’administration, si elle le souhaite, dans la définition de variables adaptées.