Some features and content are currently unavailable today due to maintenance at our service provider. Status updates

Section thématique « L’éthique de la recherche en ligne et avec des données socionumériques »

Conjuguer principes et pratiques éthiques au temps des données socionumériques : le nécessaire dialogue[Record]

  • Tania Gosselin

…more information

  • Propos recueillis par
    Tania Gosselin

Entretien avec Yannick Dufresne, chercheur à l’Université Laval qui s’intéresse aux données socionumériques depuis une décennie. Les propos ont été recueillis par Tania Gosselin (Université du Québec à Montréal). Les échanges se sont déroulés en septembre et octobre 2021.

Spécialiste de l’opinion publique, titulaire de la Chaire de leadership en enseignement des sciences sociales numériques (CLESSN) de l’Université Laval, Yannick Dufresne a participé au développement de la Boussole électorale. Il est aussi derrière le Projet Quorum, le Polimètre, ainsi que Datagotchi, une application ludique de prédiction de vote destinée à sensibiliser les citoyens à la valeur de leurs données personnelles.

YD : Avant de lancer la Chaire [de leadership en enseignement des sciences sociales numériques] il y a quatre ans, on m’avait suggéré d’utiliser « données massives » dans son nom ; je préfère parler de données numériques, car le problème n’est pas toujours le volume, c’est-à-dire le côté « big » des données. La gestion de ce type de données pose des défis techniques, mais il est important de considérer aussi les défis théoriques et éthiques qui découlent de l’exploitation des nouvelles données numériques en sciences sociales. Je suis heureux de voir que, dans le monde vaste et confus où certains parlent de données numériques et d’autres de données massives, une certaine cohésion commence à prendre forme autour de la notion de sciences sociales numériques. Dans un récent numéro de Nature, David Lazer et ses collègues parlent eux aussi de trois défis – conceptuel, méthodologique et éthique – en lien avec les sciences sociales numériques. La définition la plus classique est celle des « 3V » : le premier « V » est pour Volume. C’est l’aspect « big » – qui est relatif à la discipline, car ce qui est considéré comme étant un gros volume n’est pas la même chose en science politique et en génétique. Avant, c’était ce qui attirait toute l’attention. Et ça d’ailleurs un peu contribué à développer un certain fétichisme de la méthode. Beaucoup de travail a été fait depuis pour gérer le volume. Le deuxième « V » est celui renvoyant à la Variété des structures et de la nature de ce type de données ; je lui accorde beaucoup d’importance, car la variété des données – de sondage, de géolocalisation, textuelles, relationnelles, physiologiques – est un défi majeur. Nous ne sommes plus dans le paradigme qu’on pourrait décrire comme « rectangulaire », avec des bases de données « lignes–colonnes ». Sur Twitter, par exemple, il y a aussi des liens entre les gens ; il s’agit de mettre les données en forme pour aller chercher l’information et s’assurer qu’elles puissent contribuer à la connaissance. Le troisième « V » est pour Vélocité, le débit constant de données. Certains parlent d’un quatrième « V » pour Véracité ou Validité. La validité des données qu’on collecte et analyse est d’une importance primordiale ; sinon, on passerait non seulement à côté du grand potentiel de ces données, on risquerait même de nuire en fondant des décisions sur des conclusions erronées. Toutefois, et c’est un point de vue personnel, la validité des conclusions découle directement de la logique de la recherche scientifique qui guide la manière de relever les défis théoriques ou conceptuels. Il faut que ces données puissent avoir une validité qui permette de comprendre quelque chose qu’on ne saisissait pas avec d’autres types de données. YD : Mon champ d’expertise est l’opinion publique. Je vois que les journalistes sont sur Twitter, que les parlements rendent accessibles en ligne les discours [des élus] et de plus en plus d’informations ; il y a les initiatives de gouvernements ouverts dans les villes et ailleurs. Depuis toujours, on a besoin de connaître l’opinion des citoyens, mais les espaces citoyens numériques se fragmentent ; les gens répondent de moins en moins aux sondages. Comment trouver le moyen de continuer à capter les opinions citoyennes ? Je ne suis peut-être pas objectif à ce sujet puisque c’est ce que j’étudie, mais je ne vois pas d’avenir dans l’étude de l’opinion publique sans plonger dans les possibilités qu’offre le numérique. Les traces numériques laissées par les citoyens ne fournissent pas seulement des données d’une richesse inédite pour mieux …

Appendices