Resumen
- Explora la ética de la IA con Emma McGrattan y Chirag Mehta.
- Examina las regulaciones globales y los mandatos de transparencia de la IA.
- Aborda los retos relacionados con el acceso a los datos y su facilidad de localización.
- Analiza datos sintéticos en el entrenamiento de modelos.
Capítulos
¿Qué opinas sobre el uso ético de la IA en términos de modelos de entrenamiento y el uso de modelos en la práctica? Porque es algo que me preocupa, ya que cuando miramos ciertas geografías, puede ser que permitan que la IA se desborde y en otras geografías la estén reprimiendo o, por ahora, hasta que la entiendan mejor. ¿Qué opinas al respecto?
Quieres ser cien por cien transparente con tus consumidores y otras partes interesadas sobre lo que ha supuesto la creación de este artefacto de IA. Y luego hay otros aspectos de la IA responsable que son más posteriores, es decir, ¿para qué, para qué piensas utilizar la IA?
Es muy importante esbozar esas consideraciones éticas para que, cuando alguien esté creando un sistema de IA, piense en los datos que realmente formarán parte de ese sistema y que podrán utilizarse para diversos fines. Especialmente en lo que respecta a los datos de entrenamiento, todos los conjuntos de datos públicos han desaparecido prácticamente. Por lo tanto, el único conjunto de datos al que se tendrá acceso es el propio.
Pero, ¿adivina qué? Tus propios datos no están en el lugar adecuado y no son localizables. Por lo tanto, la localizabilidad es un problema mucho mayor.
Y creo que la gente no necesariamente relaciona la IA responsable con la búsqueda de datos. ¿Qué hay de generar datos para entrenar modelos? Se puede, siempre y cuando se tenga claro qué es ese dato sintético.
Los datos sintéticos hacen que ciertos modelos funcionen más rápido, ya sabes, y hemos visto que los datos sintéticos no solo se utilizan para el entrenamiento, sino también para la inferencia.
Así que los datos sintéticos tienen su lugar, pero no sustituyen a los datos reales, ¿verdad? No, estoy de acuerdo. Los datos son desordenados, ¿verdad?
Y los datos sintéticos van a estar limpios porque los acabas de crear para el propósito concreto que tienes en mente. Así que, cuando salgas al mundo real, no van a ser representativos de lo que nos vamos a encontrar.