Estas son las páginas web de las que ChatGPT extrae su información

Newspaper WordPress Theme
spot_img

Los programas de inteligencia artificial como ChatGPT requieren grandes cantidades de información para ejecutar sus procesos y ofrecer la mejor calidad y cantidad de datos posibles, en el caso de OpenAI, se conoce que la data, en su mayoría, proviene de millones de páginas web.

Una investigación realizada por The Washington Post indica cuáles serían las páginas web que utiliza esta inteligencia artificial para “alimentarse” y generar las respuestas de las consultas realizadas por los usuarios.

Si bien no es posible identificar las páginas web exactas que se utilizan como fuente en el caso de ChatGPT pues solo OpenAI tiene la lista completa, sí es posible identificar de qué conjunto de datos extrae la información, no solo esta, sino la gran mayoría de inteligencias artificiales.

La información en internet está organizada en grandes conjuntos que actúan como pozos que son visitados para extraer lo que se necesite de ellos.

El llamado C4 es el conjunto visitado por ChatGPT y otros modelos similares para generar respuestas a las consultas de internet y está compuesto por alrededor de 15.1 millones de sitios web de diferentes temas y orígenes.

El contenido buscado por las inteligencias artificiales también comprende algunos medios de comunicación y sitios web de recopilación de información; pero aunque muchos de ellos puedan ser fuentes fiables de producción de contenido que es útil para los usuarios, esto no implica que no se hayan incluido fuentes que aportan datosfalsos, sesgados y en muchos casos incompleto.

Estos sitios web “informativos” incluyen aquellos que difunden teorías conspirativas o información falsa, además de datos que aportan pensamientos radicales que pueden ser dañinos para los usuarios, en caso de que esta información sea presentada a modo de respuesta a una consulta.

Una muestra del sesgo informativo es que, según el estudio, se detectó que de los 20 sitios web religiosos de los que se extraen datos, 14 de ellos eran cristianos, dos eran judíos y solo uno era de tendencia musulmana.

spot_img

Artículos Relacionados

LAS MÁS LEIDAS

spot_img
spot_img