Comment concilier le Big Data et le RGPD ?

Introduction

Le big data présente des avantages non négligeables pour la société et les individus dans de nombreux domaines comme la santé, la recherche scientifique, l’environnement et beaucoup d’autres. 

Pour autant, certaines entreprises utilisent de nouvelles méthodes de collecte massive, de transmission instantanée, d’utilisation et de réutilisation des informations personnelles à des fins qui n’étaient pas établies auparavant. Cela met les principes de protection des données sous tension. 

Ainsi, l’État, se portant garant du respect des libertés individuelles et spécifiquement de la vie privée, a mis en œuvre un large panel de régulations pour éviter les abus. 
Voici tout ce que vous devez savoir pour utiliser de façon pertinente le big data au profit de votre business tout en respectant les règles.

Qu’est-ce que le big data ?

Dans le domaine commercial, le big data est une combinaison de données, structurées ou non, collectées par des organisations qui les exploitent ensuite pour obtenir des informations précieuses sur leurs clients. 

Ces informations peuvent ensuite être utilisées pour affiner les techniques de marketing afin d’accroître l’engagement des clients et les taux de conversion.

En parallèle, le big data peut aussi être utilisé en médecine pour identifier les facteurs de risque de maladie, ou par des médecins pour aider à diagnostiquer les maladies chez les patients. 
En bref, les organisations qui utilisent le big data ont un avantage concurrentiel potentiel sur celles qui ne l’utilisent pas, car elles peuvent prendre des décisions commerciales plus rapides et mieux informées, grâce aux données.

Définition du Big Data

Les cinq « V » du Big Data

Dans le cadre marketing, les 5 V du big data font référence à cinq éléments clés à appréhender et à optimiser dans le cadre d’une démarche d’optimisation de l’utilisation du big data. 

Volume

Le volume, le premier des 5 V du big data, fait référence à la quantité de données existantes. Le volume est en fait la base du big data. Il s’agit en effet de la taille et de la quantité initiale de données qui sont collectées. 

Vélocité

Le deuxième V du big data est la vélocité. Elle fait référence à la vitesse à laquelle les données sont générées et à la vitesse à laquelle elles se déplacent. Plus les données circulent rapidement, plus elles sont disponibles au bon moment et meilleures sont les décisions prises. 

Variété

Le V suivant est la variété. La variété fait référence à la diversité des types de données. Une organisation peut obtenir des données à partir d’un certain nombre de sources différentes, dont la valeur peut varier. 

Le défi de la variété concerne la standardisation et la distribution de toutes les données collectées, qu’elles soient non structurées, semi-structurées ou structurées.

Véracité

La véracité est le quatrième V du big data. Elle fait référence à la qualité et à l’exactitude des données. La véracité, en général, fait référence au niveau de confiance dans les données collectées.

Valeur

Le dernier V des 5 V du big data est la valeur. Il s’agit de la valeur que les big data peuvent apporter. Elle est directement liée à ce que les organisations peuvent faire avec les données collectées

Fonctionnement du Big Data

Les perspectives du big data suscite toujours chez les entreprises qui ne l’utilisent pas encore de nouvelles perspectives et opportunités ainsi que des réflexions sur de potentiels nouveaux modèles économiques. Seulement il est nécessaire de comprendre son fonctionnement pour l’utiliser à bon escient. 

Intégrer

Le big data rassemble des données provenant de nombreuses sources et applications disparates. Les mécanismes traditionnels d’intégration des données, tels que l’extraction, la transformation et le chargement, ne sont généralement pas adaptés à ce nouveau mode d’accumulation de données.

À cet effet, vous devez vous assurer que ces données soient disponibles sous un format adéquat pour vos analystes commerciaux. 

Pour cela, de nouvelles stratégies et technologies doivent être mises en place pour analyser des ensembles de données volumineux à l’échelle du téraoctet, voire du pétaoctet.

Gérez

C’est la deuxième étape du processus d’utilisation du big data, une fois collectées, vous devez stocker ces données volumineuses. Votre solution de stockage peut être dans le cloud, sur site, ou les deux. 

Veuillez noter néanmoins qu’à juste titre, le cloud gagne progressivement en popularité, car il prend en charge vos besoins actuels en matière de calcul et vous permet de faire tourner les ressources selon vos besoins.

Analysez

Ce n’est qu’au moment de l’analyse et de l’agissement sur ces données que votre investissement lié au big data prendra réellement forme. 

Par l’utilisation d’analyse visuelle sous forme de graphique, par le partage des résultats avec vos collaborateurs ou sous-traitants et par la construction de modèles de données avec l’apprentissage automatique et l’intelligence artificielle, l’objectif est de faire dire quelque chose aux données que vous avez récoltées.

Cas d’utilisation du Big Data

Maintenant que vous avez une idée relativement précise de la nature et du fonctionnement du big data, vous vous demandez sûrement dans quel cas et à quelles fins concrètes vous pouvez l’utiliser.

Maintenance prédictive 

Les facteurs permettant de prévoir les défaillances mécaniques peuvent être enfouis dans des données structurées, telles que l’année, la marque et le modèle de l’équipement, ainsi que dans des données non structurées qui couvrent des données de capteurs, des messages d’erreur ou de température du moteur.

En analysant ces indications de problèmes potentiels avant que ceux-ci ne surviennent, les organisations peuvent déployer la maintenance de manière plus rentable et maximiser le temps de fonctionnement des pièces et des équipements.

Expérience client 

Le big data vous permet aussi de recueillir des données provenant des médias sociaux, des visites sur le web, des journaux d’appels et d’autres sources pour améliorer l’expérience d’interaction et maximiser la valeur fournie

Ainsi vous pourrez proposer des offres personnalisées ou réduire le taux de désabonnement des clients.

Fraude et conformité 

Aujourd’hui, la sécurité de votre entreprise n’est plus mise à mal seulement par quelques pirates malveillants, mais bien par des d’équipes entières d’experts hackeurs. 

Le big data peut vous aider à identifier des schémas dans les données qui indiquent une fraude et ainsi ainsi adapter votre réponse sécuritaire beaucoup plus rapidement et pallier les menaces sur la sécurité de plus en plus changeantes. 

Favoriser l’innovation 

Les big data peuvent enfin, tout simplement, vous aider à innover en étudiant les interdépendances entre les humains, les institutions, les entités et les processus, puis en déterminant de nouvelles façons d’utiliser ces informations. 

Utiliser les données pour améliorer vos décisions en matière de finances et de planification, examiner les tendances et les souhaits des clients pour proposer de nouveaux produits, mettre en place une tarification dynamique, bref les possibilités sont infinies. 

Comment les big data sont-elles stockées et traitées ?

RGPD et Big Data – quels sont les enjeux ?

Il est important de savoir que le terme de données à caractère personnel désigne les informations relatives à une personne physique

Elles permettent d’identifier la personne directement (prénom et nom) ou indirectement (numéro de téléphone, numéro de client, voix, etc.). 

On parle alors de traitement de ces données à caractère personnel pour désigner l’ensemble des opérations effectuées : collecte, extraction, modification, transmission, etc.

Malgré les possibilités de développement qu’offre le big data aux entreprises, il comporte également des risques. La protection des données doit donc être considérée comme une priorité. 

C’est dans ce contexte que le règlement général sur la protection des données (RGPD) a été élaboré. Il définit le cadre juridique du traitement des données à caractère personnel dans l’Union européenne et renforce la loi française de 1978 sur la protection des données.

Le RGPD repose sur cinq grands principes :

  • Le principe de finalité : L’utilisation des données sur une personne physique ne peut être que dans un but bien précis, légal et légitime ;
  • Le principe de proportionnalité et de pertinence : les informations enregistrées doivent être strictement nécessaires à la finalité du dossier ;
  • Le principe d’une durée de conservation limitée : La conservation des informations sur des personnes physiques dans un fichier pour une durée indéfinie est impossible. 
  • Le principe de sécurité et de confidentialité : le détenteur du dossier doit garantir la sécurité et la confidentialité des informations qu’il a en sa possession.

Quelles sont les recommandations de la CNIL ?

Face à ces enjeux, la Commission nationale de l’informatique et des libertés (CNIL) a souhaité prendre sa part dans l’éducation aux bonnes pratiques numériques auprès des jeunes, mais également des moins jeunes. 

Pour cela, elle a organisé une consultation publique très fructueuse (plus de 700 contributions), une enquête menée en 2020, ainsi qu’une analyse juridique approfondie incluant une veille internationale active pour mieux connaître les pratiques numériques et la perception de la vie privée des parents ainsi que des enfants. 

La CNIL a ensuite publié des recommandations pour offrir aux mineurs un environnement numérique qui répond à leur besoin de protection et à leur désir d’autonomie en tenant compte de la diversité des pratiques. 

Les recommandations s’appuient sur trois points principaux :

  • Pour les mineurs : prendre en compte leur besoin d’autonomie et leurs droits tout en assurant leur protection sur Internet ;
  • Pour leurs parents et éducateurs : affirmer leur rôle fondamental de soutien dans l’environnement numérique dans un cadre respectueux de la vie privée et des intérêts de l’enfant ;
  • Pour les fournisseurs de services en ligne : prendre conscience de leur plus grande responsabilité vis-à-vis des mineurs en ce qui concerne le traitement de leurs données à caractère personnel, afin qu’ils puissent proposer aux mineurs des services en ligne qui respectent leurs droits.

Protection des données et Big Data – à quoi s’attendre ?

L’application des principes du RGPD favorise automatiquement une gestion stratégique et conforme à la loi. Le RGPD établit également le principe de la protection des données à caractère personnel par la conception, appelé « Privacy by Design« . 

Dans la pratique, toute entreprise qui prévoit d’intégrer le big data dans sa stratégie opérationnelle doit garantir la sécurité des données qui seront collectées, stockées et traitées en prenant des dispositions techniques et logistiques compatibles avec les finalités prévues.

Les mesures préventives de Privacy by Design visent à empêcher la collecte de données lorsqu’elle n’est pas justifiée par des intérêts légitimes. Elles obligent également les entreprises à supprimer les données stockées dès qu’il n’y a plus de raison valable de les conserver dans les bases de données. 

À l’ère du big data, il est donc essentiel pour les entreprises de garantir la sécurité tant des données brutes que des données traitées qu’elles collectent et stockent en permanence pour s’éviter des amendes et utiliser le big data de manière exclusivement bénéfique pour l’ensemble de la société. 

Conclusion

Le présent article ne fait indéniablement qu’aborder et illustrer les questions les plus actuelles, sans prétendre à l’exhaustivité. Il démontre toutefois que la recherche d’un équilibre entre les différents intérêts en jeu est d’une importance capitale. 

En tant qu’entreprise, il est important de ne pas se décourager malgré la régulation de plus en plus fine du big data. Gardez à l’esprit que le droit à la protection des données à caractère personnel n’est pas un droit absolu, qu’il doit être considéré par rapport à sa fonction dans la société et être mis en balance avec d’autres droits fondamentaux. 

En conséquence, il est dans l’intérêt de l’Etat de maintenir une certaine marge de manœuvre pour les entreprises de sorte à préserver le besoin de développement de technologies disruptives et l’émergence d’une véritable économie des données.