📢 Estrategias ProPicks IA para cuando el rally Tech pare. ¡Dobló al S&P 500 en julio!Desbloquee informe IA

Reddit endurece el acceso para impedir el robo de datos

Publicado 25.06.2024, 02:58 p.m
© Reuters.

Reddit anunció el martes que revisará una norma web para impedir el raspado automatizado de datos en su plataforma. Esta medida es una respuesta a los informes de que las empresas de inteligencia artificial estaban eludiendo las normas existentes para recopilar contenidos para sus sistemas. La empresa de redes sociales va a actualizar el Protocolo de Exclusión de Robots, comúnmente conocido como "robots.txt", que determina las partes de un sitio web a las que pueden acceder los rastreadores automatizados.

La decisión se produce en medio de la preocupación por las empresas de inteligencia artificial que supuestamente plagian contenidos de editores para crear resúmenes generados por IA sin la debida atribución o permiso. Las medidas actualizadas de Reddit incluirán el mantenimiento de la limitación de velocidad para controlar el volumen de solicitudes que puede realizar un solo usuario, así como el bloqueo de bots y rastreadores no identificados para que no puedan recopilar datos del sitio.

El uso de "robots.txt" ha cobrado importancia a medida que los editores tratan de proteger sus contenidos para que no sean utilizados por empresas tecnológicas para entrenar algoritmos de inteligencia artificial y generar resúmenes para determinadas consultas de búsqueda sin compensación. La semana pasada, TollBit, una empresa de licencias de contenidos, envió una carta a los editores en la que revelaba que varias empresas de inteligencia artificial se habían saltado la norma web para extraer contenidos de los sitios de los editores.

Una investigación de Wired a principios de junio sugirió que la empresa de búsqueda de IA Perplexity podría haber eludido las medidas para bloquear su rastreador web a través de "robots.txt". En un incidente relacionado, Forbes acusó a Perplexity a principios de junio de plagiar sus historias de investigación para utilizarlas en sistemas de IA generativa sin dar crédito.

A pesar de endurecer el acceso, Reddit ha confirmado que investigadores y entidades como Internet Archive podrán seguir accediendo a sus contenidos, siempre que su uso no sea comercial. De este modo, la empresa adopta medidas para proteger sus contenidos del "scraping" no autorizado y sigue apoyando las actividades legítimas de investigación y archivo.

Reuters ha contribuido a este artículo.

Este artículo fue traducido con la ayuda de inteligencia artificial. Para obtener más información, consulte nuestros Términos de Uso.

Últimos comentarios

Instala nuestra app
Aviso legal: Las operaciones con instrumentos financieros o criptomonedas implican un elevado riesgo, incluyendo la pérdida parcial o total del capital invertido, y pueden no ser adecuadas para todos los inversores. Los precios de las criptomonedas son extremadamente volátiles y pueden verse afectados por factores externos de tipo financiero, regulatorio o político. Operar sobre márgenes aumenta los riesgos financieros.
Antes de lanzarse a invertir en un instrumento financiero o criptomoneda, infórmese debidamente de los riesgos y costes asociados a este tipo operaciones en los mercados financieros. Fije unos objetivos de inversión adecuados a su nivel de experiencia y su apetito por el riesgo y, siempre que sea necesario, busque asesoramiento profesional.
Fusion Media quiere recordarle que la información contenida en este sitio web no se ofrece necesariamente ni en tiempo real ni de forma exacta. Los datos y precios de la web no siempre proceden de operadores de mercado o bolsas, por lo que los precios podrían diferir del precio real de cualquier mercado. Son precios orientativos que en ningún caso deben utilizarse con fines bursátiles. Ni Fusion Media ni ninguno de los proveedores de los datos de esta web asumen responsabilidad alguna por las pérdidas o resultados perniciosos de sus operaciones basados en su confianza en la información contenida en la web.
Queda prohibida la total reproducción, modificación, transmisión o distribución de los datos publicados en este sitio web sin la autorización previa por escrito de Fusion Media y/o del proveedor de los mismos. Todos los derechos de propiedad intelectual están reservados a los proveedores y/o bolsa responsable de dichos los datos.
Fusion Media puede recibir contraprestación económica de las empresas que se anuncian en la página según su interacción con éstas o con los anuncios que aquí se publican.
Este aviso legal está traducido de su texto original en inglés, versión que prevalecerá en caso de conflicto entre el texto original en inglés y su traducción al español.
© 2007-2024 - Fusion Media Ltd. Todos los Derechos Reservados.