¿Dónde incluir IA en sitios web de contenidos?

Me interesa de verdad la forma en que la inteligencia artificial puede combinarse con los contenidos y por eso me he pasado los últimos meses leyendo e investigando acerca de este tema, sólo para darme cuenta que hay diferentes formas y métodos para trabajar en el área.

Lo primero es decir que el uso de la IA puede ir desde lo más simple —un generador de textos a partir de datos estructurados— hasta lo más esotérico, como sería el uso de GPT-3 para escribir textos de manera automatizada.

Sin embargo, hay mucho más que se puede mirar, desarrollar y poner en práctica.

En ese sentido, me interesó mucho un artículo que describe la experiencia de Bavarian Broadcasting (BR), un grupo medial de Alemania, que usando herramientas para etiquetar el contenido han sido capaces de segmentarlo y reutilizarlo de maneras que no eran posibles antes.

En sus palabras:

«La publicación basada en datos nos ayuda a hacer más accesibles nuestros contenidos. Cuanto más segmentemos y etiquetemos nuestros contenidos, mejor se podrán encontrar y reutilizar. Esto es válido tanto para nuestros usuarios como para nuestros propios reporteros y editores que investigan en nuestros archivos. Nuestros colegas de los archivos de la BR son especialistas en etiquetado que utilizan algoritmos de reconocimiento facial para etiquetar los contenidos de vídeo o métodos de conversión de voz a texto para hacer que las grabaciones de audio y vídeo sean buscables. La integración de estas tecnologías en nuestros flujos de trabajo proporcionará un mejor servicio a nuestra audiencia y permitirá un mejor periodismo».

Incluso en una publicación (en alemán) le llaman el «principio de Lego en el periodismo» porque «gracias a los metadatos, los bloques de información pueden volver a montarse una y otra vez como ladrillos de Lego, por ejemplo para formar series temporales, agrupar contenidos sobre un tema concreto o incluso centrarse en un lugar específico».

A partir de ese artículo llegué a otro que explora nuevas formas de contar noticias y desde allí, a uno más entretenido aún que consiste en el desarrollo de un sistema basado en versiones, a partir del hecho de que los contenidos se pueden transformar en módulos, con el fin de reutilizarlos de acuerdo a las necesidades de las personas que buscan la información.

La máquina de citas

Por último, me pareció muy atractivo este proyecto de The Guardian y la agencia AFP, presentado a fines de 2021, para la extracción de citas desde noticias publicadas, basado en lo que se puede enseñar a un algoritmo para identificarlas dentro del texto. Con eso crearon «QuoteMachine» que permite hacer búsquedas más precisas de lo que alguien ha dicho acerca de un tema y de esa manera apoyar el trabajo de los periodistas en terreno cuando hacen entrevistas o deben confrontar una fuente que está hablando.

En una primera etapa trabajaron para determinar cómo se presenta una cita en el texto.
En una primera etapa trabajaron para determinar cómo se presenta una cita en el texto.
En la segunda etapa hicieron una revisión manual para determinar el grado de certeza. Usaron un software llamado Prodigy.
En la segunda etapa hicieron una revisión manual para determinar el grado de certeza.
Los creadores de la aplicación QuoteMachine la presentan durante un seminario.
Finalmente, llegaron a la aplicación QuoteMachine en la que era posible hacer búsquedas.