Strava declara la guerra a los scrapers antes de su salida a bolsa


Las empresas de IA se han convertido en entidades ávidas de datos, ya que sus modelos requieren conjuntos de datos cada vez más grandes para entrenar. Para satisfacer esa necesidad, muchas nuevas empresas de inteligencia artificial desafían convenciones de Internet de larga data, como respetar los archivos robots.txt, que indican a los rastreadores automatizados qué partes de un sitio web están prohibidas, y recopilan datos de manera agresiva. Esto ha obligado a los sitios web a restringir el acceso a sus datos y, en algunos casos, a cerrar acuerdos de licencia con empresas de inteligencia artificial. La empresa de fitness y carreras sociales Strava está dando un paso en esta dirección al restringir su sitio web e introducir tarifas para el acceso de los desarrolladores.

Para detener el scraping, la compañía está aumentando la seguridad en su sitio web y ahora solo permitirá que los usuarios autenticados vean ciertos datos. Anteriormente, los usuarios podían ver detalles como perfiles públicos y listados de gimnasios sin iniciar sesión. La compañía está poniendo todos esos datos detrás de la autenticación para protegerlos del raspado no autorizado de IA.

En el frente de API, los desarrolladores anteriormente podían comenzar a crear aplicaciones en Strava a través de un programa gratuito de acceso por niveles: solicitando primero el acceso básico y luego solicitando más a medida que su aplicación crecía. Ahora la compañía está agregando una tarifa fija de $11,99 por mes para todos los desarrolladores, aunque señaló que el precio puede variar según la geografía.

Strava dijo que su comunidad de desarrolladores ha crecido de 185.000 miembros el año pasado a 241.000 este año, y la compañía planea continuar apoyándolos. Como parte de eso, Strava también planea agregar soporte para Model Context Protocol (MCP), un estándar emergente que permite a los asistentes y aplicaciones de IA acceder a datos externos de manera estructurada, dando a Strava más control sobre exactamente qué se comparte y cómo.

La compañía también planea retirar algunos puntos finales API (puntos de acceso discretos que permiten que aplicaciones externas obtengan datos específicos, como detalles del club) para proteger los datos de los usuarios. Strava ya había endurecido las reglas de API en 2024, prohibiendo su uso para el entrenamiento de IA y limitando que las aplicaciones de terceros muestren los datos de otros usuarios. Esos cambios provocaron reacciones negativas de los desarrolladores que dijeron que sus aplicaciones se verían gravemente afectadas.

Si bien algunos desarrolladores pueden aceptar pagar una tarifa de suscripción, la desactivación de ciertos puntos finales de API aún podría afectar las aplicaciones dependientes. Strava ofrece a los desarrolladores un período de gracia de 90 días antes de realizar estos cambios.

En una entrevista con TechCrunch, Michael Martin, director ejecutivo de Strava, dijo que el scraping de IA sin control podría ser la sentencia de muerte de la Internet pública.

«Las empresas de inteligencia artificial están eliminando sin piedad los sitios web públicos, dada su interminable necesidad de datos de capacitación, lo que está degradando el rendimiento del sitio en todos los ámbitos», dijo Martin. Hemos tenido múltiples casos en los últimos meses en los que el rendimiento ha disminuido y, en algunos casos, se ha visto perjudicado. Más allá de rastrear los sitios públicos, también están intentando utilizar nuestra API para obtener acceso a nuestros datos, ignorando los términos de la API”.

Señaló que Strava ha rechazado propuestas de los principales laboratorios de inteligencia artificial que buscan acuerdos de licencia de datos. Destacó específicamente a Perplexity, diciendo que la startup de búsqueda de IA dirigió su búsqueda a través de servicios de agregación para ocultar su origen a pesar de haber sido rechazada. Esto es consistente con el hecho de que Perplexity haya sido acusado de comportamiento similar en otros lugares en el pasado.

Martin también señaló la sobrecarga del servidor causada por aplicaciones mal construidas con código de vibración, cuyas llamadas API a menudo están estructuradas de manera ineficiente y generan una carga desproporcionada en los sistemas de Strava. Es un patrón: cuando Meta prohibió los chatbots de terceros en WhatsApp el año pasado, presentó un argumento similar sobre la sobrecarga del sistema.

Probablemente el momento no sea una coincidencia. Strava solicitó de forma confidencial una oferta pública inicial a principios de este año, y su medida para proteger sus datos puede tener como objetivo indicar disciplina en los datos a los posibles inversores. La comparación con la represión de Reddit en 2024 contra el acceso a API es algo que Martin abordó rápidamente. A diferencia de Reddit, que fija el precio del acceso a la API según la cantidad de llamadas (lo que lo hace inasequible para muchos desarrolladores de aplicaciones), Strava apuesta a que una tarifa fija mantiene intacto el ecosistema de desarrolladores.

«Queremos que los usuarios sientan que son dueños de sus datos y se sientan cómodos con la forma en que los controlamos y protegemos. Pero queremos que los desarrolladores sigan prosperando y creciendo», dijo Martin.

Cuando compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta nuestra independencia editorial.



Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here