Tuve la bella oportunidad de hacer una presentación para un grupo de bibliotecarios y la aproveché para hablar de un par de temas en los que he venido trabajando hace algún tiempo, como son los datos estructurados.
En simple, bajo ese término se agrupa una serie de actividades y estándares que permiten ofrecer información acerca de lo que se publica en formatos digitales. El nombre técnico para ese tipo de datos son metadatos, es decir, datos acerca de los datos.
Mi público fueron los participantes del 3er Congreso de Bibliotecas Universitarias y Especializadas, que fue organizado por el Sisib de la U. de Chile el pasado 1 y 2 de junio, aquí en Santiago. Y, debo confesar que no los traté muy bien. Pero no porque les dijera cosas malas, sino que porque aproveché la ocasión para hacer más relevante su papel y expresarles que si ellos no hacen su papel de ofrecer mejores datos y relacionar los existentes, otros harán ese papel.
Usar los estándares
Porque lo que se juega al usar los estándares que permiten agregarle datos estructurados a un espacio de información, es la posibilidad de que pueda ubicarse mejor en las páginas de resultados de Google y además, como se muestra en las slides, que otras redes sociales saquen provecho de los datos y muestren de mejor manera el contenido. Así lo hace Google con sus rich cards, Facebook con Open Grahp Protocol y Twitter con sus Twitter Cards.
Sin embargo, hay más. Gran parte de lo que se está investigando en estos días tiene que ver con chatbots y máquinas que aprenden. Lo que se pueda hacer en ambos casos, dependerá de la información que esté disponible para que esos software la usen. Por lo mismo, si los datos están con una estructura completa, parte importante de la solución estará lista. Y eso es un trabajo que hay que partir ahora, para que en el futuro se puedan usar esos datos. De allí que aunque trabajar en metadatos no sea vea sexy, es clave para el futuro.
La BBC va más allá
Dicho todo lo anterior y mientras preparaba este post, apareció la publicación de Online Journalism acerca de este mismo tema. Claro que no contando una teoría (como es mi caso), sino que la experiencia de la BBC usando metadatos al nivel mayor: los datos enlazados. Gracias a esto, que se lleva a cabo mediante una buena capa de tecnología y datos (por ejemplo el proyecto Elastic News), ellos están llegando a lo que llaman el “periodismo estructurado“, en el que cada pieza de información es catalogada y enlazada al área y personas a la que se refiere, de tal manera que los periodistas no tengan que escribir todo de nuevo, sino que puedan reutilizar la información que ya han generado antes.
En sus palabras:
The idea is that the content is a set of individual assets whose relationships and associations are described through metadata.
Es decir: “la idea es que el contenido es un conjunto de elementos individuales cuyas relaciones y asociaciones son descritas a través de los metadatos”.
Gracias a eso la producción de nuevos contenidos se facilita y, lo que es mejor, la experiencia del usuario que los consume, se enriquece.
Mi presentación
Como ven, hay mucho para ver, leer y aprender, como siempre. Así que para terminar, les dejo las láminas que usé para presentar:
Para qué queremos tener datos estructurados hoy from Juan C. Camus