Posté le Le 24/11/2022 à 04:23
Bonjour a tous,
je me posais pas mal de questions a l'instant concernant le scrapping de données, que ça soit sur des sites de types pages jaunes ou tout autre annuaire.
Légalement, il est interdit de scrap des données. Par exemple si je récupère les données sur le site des pages jaunes ou des pages blanches pour les réutiliser, j'utilise des données qui sont la propriété d'une entreprise privée et je dois demander l'accord de cette entreprise pour les utiliser librement.
Le problème c'est que dans le même temps, toutes les données que cette entreprise a elle même construit sa base de données sans jamais demander aux personnes ou entreprises inscrites si elles étaient d'accord pour apparaître et pire encore, pour disparaître de ces base de données, il faut le demander voir payer.
Du coup, en quoi une entreprise quelle qu'elle soit pourrait revendiquer un droit sur des données acquises sans consentement pour les pages blanches par exemple, puisque cela touche à des données personnelles?
Et en quoi des données professionnelles (les pages jaunes) pourraient également être la propriété d'une entreprise, alors qu'elles sont disponibles librement sur des bases de données gouvernementales ou autres.
J'ai un peu de mal à saisir la logique derrière tout cela.
Posté le Le 24/11/2022 à 20:40
Bonsoir Salsifi,
A mon avis, les questions que vous vous posez sont principalement dues à un certain nombre de méconnaissances sur le sujet. C'est loin d'être une tare, mais il vous faut lire sur le côté historique du sujet, voir comment la Loi est peu à peu intervenue, comment elle a pu être contournée et a ensuite évolué.
Dans l'Histoire des hommes, tout cela est fort récent et évolue encore "rapidement".
Pour reprendre un de vos exemples, avec les 'pages' des annuaires, l'objet initial était juste d'informer ceux qui cherchent, par exemple, le téléphone d'un voisin. Puis sont venues les adresses. A partir d'un certain temps, des sociétés commerciales ont vu l'intérêt de créer des fichiers adresse pour gérer leurs publicités. Il s'est fait tout un marché autour de cela. Certaines sociétés embauchaient des gens (en travail à la maison) pour recopier des adresses sur des enveloppes, ou sur des formulaires à partir de sources diverses, d'autres demandaient de fournir 10 adresses d'amis contre un cadeau.
La "société" était informée, les ménagères recevaient des publicités de produits inconnu, tout le monde était content.
Certaines sociétés plus ou moins d'Etat avaient des fichiers et se sont mises à les vendre.
Au bout de quelques dizaines d'années, il y a eu des plaintes, des exagérations, et le législateur a commencé à mettre de l'ordre dans tout cela.
Dans les documents-contrats ont commencé à apparaitre des mentions sur la possibilité d'utiliser l'adresse ou pas.
Au début, il fallait écrire en plus pour dire NON. Puis, les documents ont été assortis d'une case que l'on devait cocher pour dire NON, et maintenant, la loi oblige à la présence d'une case à cocher pour dire OUI.
La CNIL a été créée, les fichiers de personnes doivent être déclarés, etc.
Après, c'est un problème économique. Scrapper des tas de pages du WEB peut demander du temps avant qu'il en sorte un fichier correct, et acheter un fichier peut coûter moins cher.
En plus, une page WEB, aujourd'hui, est une publication. Elle est protégée. Sa nature particulière oblige à une législation spécifique.