"Nous devons nous demander comment traiter les données piratées"
Ces dernières années, des bases de données ont été piratées à plusieurs reprises et les pirates ont publié les données volées sur Internet. Les scientifiques ont-ils le droit d'utiliser de telles données pour leurs recherches ? Le bioéthicien de l'ETH Marcello Ienca et la professeure Effy Vayena se sont penchés sur cette question dans une publication spécialisée parue dans la revue "Nature Machine Intelligence". Actualités ETH s'est entretenu avec Ienca.
Actualités ETH : Les scientifiques ont-ils le droit d'analyser des données piratées et publiées sur Internet, d'un point de vue purement juridique ?
Marcello Ienca : La réponse courte est oui - du moins si les scientifiques ne sont pas eux-mêmes responsables du piratage, car le piratage lui-même est un délit. Mais si des pirates anonymes publient des données sur Internet, il s'agit de données publiques. La situation est moins claire lorsque les scientifiques souhaitent télécharger ces données sur leurs propres ordinateurs. Dans certains pays, cela pourrait être interprété comme une possession de biens volés. Je n'ai toutefois pas connaissance d'un cas où des scientifiques auraient été inculpés pour cela.
Et qu'en est-il d'un point de vue éthique ? Les scientifiques ont-ils le droit de faire tout ce qui est autorisé par la loi, c'est-à-dire d'analyser des données qui ont été volées à quelqu'un à l'origine ?
Non, car la science n'est pas une activité comme une autre, mais une prestation culturelle humaine avec des exigences éthiques élevées. En tant que scientifiques, nous avons une responsabilité sociale que nous devons assumer. C'est pourquoi la seule perspective d'acquérir de nouvelles connaissances ne suffit pas pour mener une étude. La science doit être pratiquée avec soin et responsabilité.
Dans leur travail, ils donnent quelques exemples d'analyses de données piratées : Les données détaillées des utilisateurs de la plateforme de rencontres entre personnes étrangères Ashley Madison ainsi que les journaux de guerre de l'armée américaine en Afghanistan et en Irak. Des scientifiques ont analysé ces données au cours des dernières années. Cela était-il éthiquement acceptable ?
Dans certains cas, cela peut avoir été justifiable, dans d'autres moins. Dans notre étude, Effy Vayena et moi mettons l'accent sur le fait que la recherche scientifique utilisant des données piratées est toujours moralement problématique. Toutefois, dans des circonstances et des conditions très spécifiques, une telle analyse pourrait être éthiquement acceptable. Nous citons six conditions dans notre étude :
- La source des données et le contexte de leur collecte doivent être rendus transparents. Cela doit également permettre d'éviter que d'autres scientifiques se sentent obligés de voler eux-mêmes des données.
- La vie privée et la protection des données doivent être respectées. Les scientifiques doivent rendre les données anonymes, même lorsque des données personnelles sont accessibles au public dans le cadre d'un piratage.
- Le projet de recherche ne doit pas exposer une personne concernée à un risque plus élevé que celui qu'elle court peut-être déjà en raison du piratage.
- Le projet de recherche doit avoir une grande utilité scientifique et sociale.
- L'objectif de la recherche ne peut être atteint qu'en utilisant les données piratées et pas autrement.
- Enfin, tout projet de recherche utilisant des données piratées devrait être soumis à l'approbation d'une commission d'éthique.
Existe-t-il en fait des limites à l'utilisation de données provenant de sources moralement condamnables ? Serait-il par exemple éthiquement acceptable de réutiliser aujourd'hui les résultats d'expériences médicales menées sur des prisonniers dans des camps de concentration du troisième Reich pour les analyser à nouveau ?
Il existe dans le monde scientifique un consensus clair selon lequel il ne faut pas faire d'études contraires à l'éthique. Et ces expériences étaient contraires à l'éthique, cela ne fait aucun doute. Ce qui est plus difficile, c'est de savoir ce que d'autres scientifiques peuvent éventuellement faire des résultats lorsque les études ont déjà été faites. Car dans ce cas, les scientifiques ne sont pas impliqués dans le comportement contraire à l'éthique. En principe, les critères mentionnés ci-dessus peuvent également être appliqués à d'autres cas de données obtenues de manière moralement problématique ou clairement répréhensible.
Revenons aux données piratées accessibles au public. Aujourd'hui, la recherche avec des données accessibles au public ne nécessite généralement pas l'autorisation d'une commission d'éthique. Un changement serait-il nécessaire ?
Oui, la recherche utilisant des données piratées ne doit pas, selon nous, être mise sur le même plan que les autres recherches utilisant des données publiques. Il ne devrait pas appartenir aux chercheurs individuels de déterminer si un projet de recherche utilisant des données piratées remplit les cinq premières conditions mentionnées. Cette évaluation devrait être effectuée par une commission d'éthique professionnelle. On pourrait intégrer ce point dans la législation relative à la recherche sur l'être humain.
Que reste-t-il à faire d'autre ?
Par notre travail, nous souhaitons lancer un débat au sein de la communauté scientifique. Nous espérons que cette discussion aboutira à un consensus. Et nous tenterons de formuler, en collaboration avec des organisations internationales et des sociétés savantes, des lignes directrices et des recommandations éthiques sur le traitement des données piratées. Nous partons du principe qu'avec l'augmentation de la cybercriminalité, la quantité de données piratées accessibles au public va également augmenter. En tant que scientifiques, nous devons nous demander ce que nous devons faire de telles données.
A propos de la personne
Marcello Ienca était jusqu'à récemment ma?tre-assistant dans le groupe d'Effy Vayena, professeure de bioéthique à l'ETH Zurich, et il est désormais chef de groupe à l'EPFL. Ses recherches portent notamment sur l'éthique des données biomédicales, l'intelligence artificielle et les technologies à l'interface entre l'homme et la machine.
Référence bibliographique
Ienca M, Vayena E : Ethical requirements for responsible research with hacked data, Nature Machine Intelligence 2021, 3 : 744, doi : page externe10.1038/s42256-021-00389-w