Si vous avez l'habitude de rechercher des publications Reddit sur des moteurs de recherche comme Bing ou DuckDuckGo, vous remarquerez peut-être un changement : le contenu récent de Reddit n'apparaîtra pas à moins que vous n'utilisiez Google. Ce changement intervient après que Reddit a décidé d'empêcher les principaux moteurs de recherche et leurs robots d'exploration Web IA d'accéder à ses publications à moins qu'ils ne paient pour ce privilège.
Le nouveau paysage de la recherche
Tim Rathschmidt, porte-parole de Reddit, a déclaré : « Nous avons eu des discussions avec plusieurs moteurs de recherche. Nous n’avons pas réussi à conclure d’accord avec chacun d’entre eux, car certains ne peuvent pas ou ne veulent pas faire de promesses exécutoires concernant leur utilisation du contenu Reddit, y compris son utilisation pour l’IA. »
En conséquence, seul Google a obtenu un accord pour afficher les publications récentes de Reddit, tandis que d’autres moteurs de recherche comme Bing continueront d’afficher du contenu plus ancien mais pas les dernières mises à jour.
Impact sur l'utilisateur
Pour de nombreux utilisateurs, Reddit est une source incontournable de réponses personnelles et humaines à diverses questions, qu'il s'agisse de trouver des astuces pour un jeu vidéo, des recommandations de soins de la peau ou des conseils généraux. En règle générale, l'ajout de « site
Les meilleurs résultats sont obtenus en tapant « .com » ou « Reddit » à la fin d'une requête de recherche. Cependant, si vous utilisez d'autres moteurs de recherche que Google, vous risquez de voir apparaître des publications Reddit obsolètes, ce qui frustrera les utilisateurs.
Google et Reddit signent un accord de 60 millions de dollars
Plus tôt cette année, Google a conclu un accord de 60 millions de dollars avec Reddit pour permettre à ses robots IA d'accéder au contenu de Reddit. Cet accord fait suite à une panne de Reddit l'année dernière, en signe de protestation contre les changements d'API, qui ont eu un impact significatif sur l'accès de Google à divers subreddits. Cependant, Rathschmidt a précisé que la récente décision de bloquer les moteurs de recherche n'est « pas du tout liée à notre récent partenariat avec Google ».
La position ferme de Reddit sur le scraping de données
Le fichier robots.txt mis à jour de Reddit empêche désormais les robots d'exploration du Web d'accéder à ses données sans autorisation, soulignant que les données de Reddit ne sont pas gratuites. Cette mesure fait partie de la stratégie plus large de Reddit visant à contrôler son contenu et à garantir qu'il ne soit pas utilisé par des modèles d'IA sans compensation appropriée.
Microsoft a pour sa part pris acte de la position de Reddit. Caitlin Roulston, porte-parole de Microsoft, a déclaré : « Microsoft respecte la norme robots.txt et nous respectons les instructions fournies par les sites Web qui ne souhaitent pas que le contenu de leurs pages soit utilisé avec nos modèles d'IA génératifs. »
Conclusion
Les mesures audacieuses de Reddit visent à fixer des limites claires quant à l'utilisation de ses données, notamment en ce qui concerne l'IA. Pour l'instant, si vous recherchez des conseils récents sur Reddit, vous devrez utiliser Google. D'autres moteurs de recherche pourraient éventuellement conclure des accords avec Reddit, mais en attendant, ils ne fourniront que du contenu Reddit plus ancien.
