Comment le chinois ByteDance (TikTok) utilise son robot Bytespider pour pomper les sites des médias
Les éditeurs ont fait part de leurs inquiétudes quant au problème auquel ils sont confrontés lorsqu'il s'agit de bloquer le robot IA de ByteDance appelé Bytespider.
La société chinoise de technologie Internet , connue pour avoir développé TikTok, aurait utilisé des sites d'information britanniques pour former son concurrent ChatGPT appelé ByteSpider sans payer ces sites Web ni obtenir leur autorisation appropriée.
ByteDance a été accusé d'exploiter un robot qui ciblait des éditeurs renommés tels que The Guardian, Daily Mail et The Telegraph.
Selon le géant technologique basé à Pékin, son robot IA ByteSpider est utilisé à des fins " d'optimisation de la recherche ". Cependant, les agences de presse ont fait part de leurs inquiétudes concernant la violation du droit d'auteur, suggérant que les sociétés d'IA utilisent leurs articles pour former leurs chatbots sans autorisation.
En particulier, les éditeurs ont soulevé un problème lié au manque de transparence de ByteDance, selon un rapport du Telegraph . Apparemment, ils ont du mal à bloquer ByteSpider.
Il convient de noter que la BBC, The Guardian, le New York Times et CNN ont empêché OpenAI, la société derrière ChatGPT, de détecter leurs sites en raison de problèmes de droits d'auteur.
Notamment, les médias utilisent les fichiers " robots.txt " pour indiquer aux robots d'exploration quelles parties du site les outils d'IA sont autorisés à visiter. Bien que Bytespider ne contourne apparemment pas les fichiers robots.txt, le code exact requis pour activer le blocage est encore inconnu.
Owen Meredith, directeur général de l'Association des médias d'information, a déclaré : "C'est une autre démonstration de la façon dont les grandes entreprises technologiques exploitent la propriété intellectuelle des créateurs et des détenteurs de droits pour prendre leur contenu et en extraire de la valeur sans autorisation, notification ou transparence."
Meredith a ensuite décrit cela comme un " vol massif de leur contenu " inacceptable.
ByteDance prêt à entrer dans l'espace de l'IA
La rumeur court que ByteDance se prépare à faire une incursion dans le domaine en plein essor de l'IA et à suivre les traces des géants technologiques basés aux États-Unis comme Google, Microsoft et OpenAI.
Dans cette optique, la société chinoise serait en train de développer une plateforme ouverte qui permettrait aux utilisateurs de créer leur propre chatbot.
Faisant référence à l'enquête sur l'IA menée par la Chambre des Lords, qui fait allusion à la chambre haute du Parlement britannique, The Guardian a déclaré que le manque de transparence est la raison pour laquelle les éditeurs devraient avoir la possibilité de se retirer du web scraping. plutôt que d'être obligé de se retirer.
Selon des sources de l'industrie, les éditeurs de presse indépendants et locaux, notamment National World et Tindal, ont signalé une activité suspecte similaire de robots.
Les médias et autres organisations créatives ont déjà fait part de leurs inquiétudes concernant l'utilisation par les géants de la technologie de la propriété intellectuelle sans autorisation. Par exemple, un groupe d'écrivains, dont le romancier de "Game of Thrones", George RR Martin, a accusé OpenAI de "vol systématique" à grande échelle plus tôt cette année.
De même, le Daily Mail se prépare à une bataille juridique avec Google, accusant le géant de la recherche d'utiliser des milliers de ses actualités en ligne pour former le chatbot Bard AI. Les entreprises technologiques, quant à elles, affirment que leur utilisation de matériel protégé par le droit d'auteur est régie par la clause d'utilisation équitable.
En fait, Microsoft estime qu'il ne devrait pas être tenu responsable si l'utilisateur final utilise un outil d'IA comme Copilot pour enfreindre du matériel protégé par le droit d'auteur.
© Copyright 2024 IBTimes UK. All rights reserved.