Por Hannah Pérez  

Un cambio en la política de privacidad de Google permitirá a la empresa hacer uso de cualquier información pública para entrenar sus diversos productos y servicios de inteligencia artificial.

***

  • Google cambió sus políticas para recopilar datos para el entrenamiento de sus sistemas de IA
  • Lo que usuarios compartan en línea ahora será utilizado por Google para desarrollar productos de IA
  • El debate de “web scraping” está más vivo que nunca en medio del auge de la inteligencia artificial

Los rápidos desarrollos en el área de la inteligencia artificial (IA) han aumentado aún más el apetito de las empresas tecnológicas por los datos. Esto es algo que Google está dejando muy en claro con sus nuevas políticas.

La gigante de tecnología y de servicios de búsqueda en línea, publicó recientemente una actualización de sus políticas de privacidad en un esfuerzo para poder recopilar cualquier tipo de información disponible públicamente para entrenar a sus sistemas de IA.

Las nuevas condiciones establecen que la empresa podrá recopilar y analizar datos que las personas compartan en línea, y podrá hacer uso de los mismos para entrenar, mejorar y desarrollar nuevos productos y servicios impulsados por IA. Las políticas y términos de privacidad de Google se actualizaron el 1 de julio de 2023, según se muestra en el sitio web.

Google utiliza la información para mejorar nuestros servicios y desarrollar nuevos productos, funciones y tecnologías que beneficien a nuestros usuarios y al público“, dice la entrada, antes de especificar:

Por ejemplo, usamos información disponible públicamente para ayudar a entrenar los modelos de IA de Google y crear productos y funciones como Google Translate, Bard y capacidades de IA en la nube.

Cambio en la política de privacidad de Google

Una mirada cercana a las condiciones actualizadas de privacidad de Google muestran que el movimiento marca un cambio claro con respecto a los términos de servicio anteriores de la empresa.

Antes de la actualización de este fin de semana, la política establecía que la compañía podía acceder y hacer uso de los datos de las personas para mejorar los modelos de “lenguaje“. Ahora, los términos del servicio han incluido claramente la palabra “IA” para indicar que Google se reserva el derecho de usar los datos de las personas para los desarrollos de sus productos en esta área en particular.

La compañía detalló en su actualización de política que están incluidos los sistemas de traducción, los sistemas que generan texto y los servicios de IA en la nube. En específico, anteriormente los términos solo incluían al servicio de traducción de Google, mientras que ahora también se mencionan Cloud AI y Google Bard.

«Web scraping» y las preocupaciones de privacidad

La nueva política de Google significa que ahora la compañía podrá hacer uso de cualquier información que compartan los usuarios públicamente en Internet con fines de la capacitación de sus modelos de inteligencia artificial, un tema que sin duda plantea serios problemas y preocupaciones de privacidad.

Los modelos de IA generativa, como el popular ChatGPT, se entrenan a partir de un conjunto de datos que les permiten analizar y responder texto en varios contextos e idiomas. En el caso del chatbot desarrollado por OpenAI, el sistema aprovecha la información disponible públicamente en Internet para su entrenamiento.

Este proceso de extracción de contenido y datos en línea, bien sea para el entrenamiento de IA u otros fines, se conoce como “web scraping” o “raspado de datos, por su traducción literal al español. Además de la extracción de datos, esta práctica incluye el análisis de dichos datos mediante las mediciones de los sentimientos de los mismos usuarios

Los recientes avances en la IA han motivado las discusiones acerca de la eticidad y legalidad del web scraping, y la práctica por parte de los los gigantes tecnológicos se ha vuelto una discusión fundamental en el debate sobre el uso de datos de los consumidores y la privacidad.

El debate: de quiénes acceden a los datos a cómo se utilizan 

La nueva política de Google coincidió con un cambio en Twitter que estaría motivado por este mismo debate. Elon Musk, presidente ejecutivo de Twitter, anunció el fin de semana que la plataforma de redes sociales comenzará a restringir la cantidad de tweets que diferentes cuentas pueden leer cada día para evitar “niveles extremos” de extracción de datos y manipulación del sistema.

También coincidió con una demanda colectiva “sin precedentes presentada en California contra OpenAI que afirma que la empresa detrás de ChatGPT usó datos de millones de comentarios en redes sociales, blogs, Wikipedia y otra información personal de los usuarios para entrenar a su sistema de IA sin obtener previamente el consentimiento de los usuarios. La demanda alega que la empresa, por lo tanto, violó los derechos de autor y privacidad de millones de usuarios en Internet.

Si bien el tema del uso y manipulación de datos privados en línea ha sido un problema durante las últimas décadas, el reciente auge de la inteligencia artificial destaca una nueva dimensión de la discusión. Si antes nos preocupaba quiénes podían acceder a los datos, ahora la pregunta sobre el cómo podrían utilizarse tales datos se añade y toma el centro del debate.


Artículo de Hannah Estefanía Pérez / DiarioBitcoin

Imagen de Unsplash 

ADVERTENCIA: Este es un artículo de carácter informativo. DiarioBitcoin es un medio de comunicación, no promociona, respalda ni recomienda ninguna inversión en particular. Vale señalar que las inversiones en criptoactivos no están reguladas en algunos países. Pueden no ser apropiadas para inversores minoristas, pues se podría perder el monto total invertido. Consulte las leyes de su país antes de invertir.