Archivo de la etiqueta: Datos

Temas relacionados con gestión y visualización de datos

¿Qué es la visualización de datos?

Invitado a una clase de periodismo, llevé el tema de Visualización de Datos, con la presentación que muestro más abajo.

En ella explico el tema y doy varios ejemplos de cómo se hace y cómo se trabaja; incluso, al final se entrega una enlace con un archivo de datos para practicar.

¿Por qué el tema es relevante?

Porque cada vez más gobiernos nacionales y estatales alrededor del mundo, están comenzando a entregar la información que producen de manera completa y en formatos fáciles de usar.

Con esto nos referimos a que los datos no están en un gráfico y comentados, sino que sólo están simples y puros. Es decir, información y números, separados por comas y en una forma en que cualquiera los puede tomar y usar. Hoy muchos de los datos están dentro de archivos pdf, e incluso, como imágenes.

Y, ojo, que el próximo año viene el Censo en Chile, que será una oportunidad para esto mismo y que hasta donde se ha informado, no contempĺa esta posibilidad.

La iniciativa de los datos públicos y de libre acceso partió en Gran Bretaña con Data.gov.uk y siguió en Estados Unidos con Data.gov. E incluso, en Chile ya estamos viendo un ejemplo muy inmaduro aún, pero que al menos representa el inicio con Datos.gob.cl.

Ya en el país había algunas iniciativas con la Base de Datos del Banco Central, el API de la SBIF (disclaimer: yo tengo que ver con ese proyecto) y la información ofrecida mediante el Buscador de Transparencia del Gobierno de Chile.

¿Qué es lo que falta? Que haya más iniciativas privadas, de ciudadanos interesados en tomar los datos y crear proyectos de información. El mejor ejemplo es la Fundación Ciudadano Inteligente, que ha sido felizmente destacada por su trabajo y el grupo de desarrolladores que se juntan en el colectivo Huevapi, que han producido interesante resultados.

Faltan más… y por eso, mi clase, que se las dejo por si quieren mirar un poco más.

Nuevos desafíos para los diarios digitales

¿Hacia dónde debería ir el periodismo digital?

Quienes pasan por estas páginas de manera habitual, se habrán dado cuenta que de tanto en tanto, estoy trabajando en nuevos conceptos en el tema. Pues, ahora quiero contarles de otro más 🙂

El nombre provisorio que le he dado es la “redacción de segundo piso” y se refiere a la necesidad que tienen las redacciones digitales, de ir más allá de la cobertura en tiempo real (tiempo presente o actual, debería llamarse) y comenzar a trabajar en formas de visualización de datos y en aplicaciones que le ofrezcan más oportunidades interactivas a los usuarios. La idea es no depender sólo del texto, sino que sacarle más provecho al computador que ellos usan para ver la información que se les entrega por esta vía.

Así, mientras en el “primer piso” se hace la cobertura de última hora, con actualizaciones permanentes y un seguimiento minuto a minuto de lo que ocurra, debe existir este “segundo piso“, en el que se permita tener más tiempo para contar las historias.

Pues bien, respecto de esto, hace algunos meses tuve el gusto de conocer a Dardo Ceballos, un periodista y profesor argentino con un gran nick en Twitter: @eldardo. Él trabaja en la Universidad Nacional de Rosario, en Argentina, y en una visita que hizo el año pasado, conversamos largamente del tema. En esa ocasión me hizo una entrevista que grabó en video, la que acaba de publicar, junto a una nota sobre el tema. Allí se refleja lo que conversamos acerca de cómo sigue la evolución del Modelo Margarita que di a conocer en mi libro.

Les dejo entonces el video y el área de comentarios para contar lo que les parecen estas ideas.

Las nuevas tareas que nos imponen los datos

Hay un mundo de datos allá afuera, esperando que alguien los descubra, relacione y cuente historias a partir de ellos.

Esta declaración cada día es más válida y abarca el ámbito de acción de muchas profesiones, para las cuales la información que se obtiene de sus operaciones es cada vez más profusa y por lo mismo, requiere de profesionales que le den forma y le saquen sentido.

¿A qué viene todo eso? Pues, a que me parece muy relevante dejar claro que un “descubrimiento” de este 2010 que se termina, es la necesidad de aprender nuevos trucos para trabajar con los datos. Entre ellos se cuentan los de visualizar datos (es decir cómo se muestran); acceder a los datos (acá aparece el concepto de Open Data) y finalmente, programar aplicaciones que permitan hacer lo anterior (incluyendo, por cierto, la reación de mashups).

Imagen de The Guardian sobre visualización de datos.
Imagen de The Guardian sobre visualización de datos.

Bueno, todo lo anterior tiene antecedentes concretos. El primero es lo que está haciendo The Guardian en Inglaterra en este tema. Ellos acaban de abrir esta semana un blog sobre visualización de datos, en el que van a ir publicando sus experiencias en el tema.

Un segundo espacio que muestra esta tendencia, es el sitio de David McCandless, un periodista británico que afirma sin dudar que la información es bella y se dedica a probarlo con sus creaciones. No hablamos de arte (aunque podría llegar a serlo), sino de cómo desplegar de manera elegante los datos, desde los resultados de un test de sangre, hasta la explicación sobre el real tamaño de un continente como África.

Lo anterior no estaría completo, si no nombramos a los “curadores de datos“. Aunque la explicación de Mancini es muy buena, me gustaría agregar que un desafío relevante para quienes trabajen con datos, siempre será la elección de lo que se quiere mostrar y contar. Para esta tarea, habrá que asumir la tarea de curatoría digital, incluyendo en dicha actividad las acciones de elegir, clasificar, destacar y presentar los datos que sean relevantes para narrar una historia y dar cuenta de una realidad.

Como se puede apreciar, se abre un mundo de oportunidad y trabajo y quienes lleguen primero a él -ya hay varios que viven allí- lograrán hacer cosas muy interesantes.

Termino con la explicación que da The Guardian acerca de su blog: “Nuestro trabajo es hacer que los datos sean accesibles y fáciles de entender”. ¿No es lo que cualquier profesión debe hacer?

Una IDEA para medios online

Desde hace algún tiempo que ando pensando acerca de cómo deben ser los medios online, lo que se ha visto reforzado por la aparición tan poderosa de espacios como Wikileaks y otros que obligan a que desde Internet se den respuestas diferentes a las que se entregan desde los medios tradicionales.

Por ejemplo, tanto El País en España como The New York Times, dos de los medios que han participado de la cobertura mundial, han creado áreas especiales para el tema en las que van destacando las novedades (como la detención de Assange esta mañana), como también, mecanismos para que el propio usuario elija lo que quiere revisar. En el primero, hay un selector por países que permite ir hacia todo lo que se ofrece por zona geográfica, mientras que en el segundo, hay una selección editorial que da lugar a un grupo de cables ordenado por tema.

La imagen muestra las interfaces de dos medios ofreciendo acceso a los cables de Wikileaks
Dos interfaces para acceder a los cables de Wikileaks. A la izquierda, El País separa por áreas geográficas y a la derecha, The New York Times lo hace por temas.

En ambos casos, la acción se traslada al usuario, quien tiene a su cargo la tarea de mirar, buscar, filtrar y gastar a su antojo el tiempo que estime necesario en el tema. Vale decir, podemos afirmar que estos medios online explotan sus capacidades interactivas para dar acceso a grandes cantidades de información, dejando en manos del usuario la capacidad de elegir qué ver y a qué ritmo hacerlo.

Al mismo tiempo, esta forma de operación me lleva a plantear las cuatro zonas en las que los medios online tienen capacidades interesantes, las que podemos resumir en este acrónimo: IDEA.

  • I – Información: vale decir, los medios online viven de la información y responden a la necesidad de estar siempre actualizados; sin ese flujo de nuevo material, se pierde uno de los sentidos más potentes que tiene esta tecnología.
  • D – Documentación y Referencia: los medios online ofrecen la capacidad de agregar contexto, gracias a su hipertextualidad; dado esto, la tecnología web permite seguir aprendiendo de un tema vía navegación y por tanto, los medios deben explotar esta característica ya sea mediante contenidos propios u otros que existan como recurso a un link de distancia. No hay que temer a que el usuario se aleje; siempre volverá al sitio que le ofreció un enlace de interés.
  • E – Experiencia y Experimentación: los medios online deben tener siempre puesto su foco en lo que pasa en sus páginas y buscar permanentemente nuevas tecnologías que le permitan hacer una oferta que aumente el valor de cada visita. No se puede mantener la experiencia, por buena que sea, en forma permanente, siempre debe haber ofertas nuevas en cuando a acceso, visualización y especialmente, interacción con los contenidos ofrecidos.
  • A – Actividad: los medios online deben ofrecer que “pase” algo durante la visita del usuario; debe existir algún tipo de actividad, lo que se puede resumir en las acciones que se puedan ejecutar desde sus páginas. Estas acciones deben ser las que permiten que un visitante (ocasional) se transforme en usuario (frecuente) y termine siendo quien recomiende nuestro sitio (evangelista) y finalmente, quien compre lo que se pueda vender (cliente) de nuestras páginas. Esto sólo se consigue cuando el visitante puede hacer click sobre una aplicación o funcionalidad y ésta ejecuta la tarea que se espera de ella. Esa confianza que se gana mediante un click, crecerá hasta apoyar los emprendimientos que se hagan desde el medio que pone el “botón para clickear”.

En resumen, viendo lo que pasa en los medios internacionales con los documentos filtrados de la diplomacia de Estados Unidos, podemos adivinar en cuál de estas etapas están los medios que ofrecen dicha información y entender las razones de su ventaja sobre los demás.

Big Bang Data o cómo cambian las profesiones

Ejecutando mi papel de anfitrión en Big Bang Data (foto: P. Astorga)
Ejecutando mi papel de anfitrión en Big Bang Data (foto: @pastorga)

Gracias a la invitación de los alumnos del Taller Multitask de la Escuela de Diseño de la U. de Chile, tuve la oportunidad de actuar como el anfitrión de Big Bang Data, un seminario en que hablamos de visualización de datos.

En realidad, mi colaboración con ellos partió un par de semanas antes, cuando pude conocer a los alumnos en la sala de clases, junto a sus profesores Juan Paulo Madriaza y Jacob Bustamante, ambos integrantes del blog Digilicious y con quienes he tenido el gusto de abordar proyectos conjuntos antes.

El seminario tuvo varios puntos altos, comenzando por la asistencia que sobrepasó todas las expectativas; hay que decirlo, hay mucho interés por lo digital. Más de 400 personas hicieron fila a las 8:00 de la mañana de un día sábado, justo cuando se jugaba uno de los partidos más esperados del Mundial de fútbol.

También el nivel de la discusión, en particular el panel final donde llegamos entre todos (panelistas y quienes preguntaban) a un hecho que ya deberíamos tomar todos en cuenta: las profesiones que tenemos tienen que evolucionar para incluir elementos informáticos en ellas. Se llegó casi a la conclusión que un diseñador que quiera trabajar en lo digital, no debe quedarse sólo en lo suyo (la forma), sino que ir más allá y participar del proceso. No quedarse al final esperando el resultado, sino que ayudar a generarlo.

En los ratos en que pude hablar con los asistentes al seminario, recibí un mensaje similar desde otras profesiones: abogados periodistas, ingenieros. Todos ellos me decían que era importante cruzar la línea y no sólo entender, sino que aprender a hacer lo que hacía el otro; no para quitarle el trabajo y ser hombre orquesta, sino que para participar de mejor manera en los grupos interdisciplinarios en los que cada vez más, hay que trabajar para sacar adelante los proyectos cada vez más complejos que debemos abordar.

Por último, quiero decir que fue una experiencia muy interesante la del seminario y espero que se hagan público los elementos que se consiguieron durante su desarrollo, ya que una de las gracias del evento es que como se trató del trabajo de un curso universitario, los 16 alumnos que lo llevaron a cabo cumplieron muchas tareas. Varias de ellas eran registrar el evento, así que podemos asegurar que en su sitio seguirán apareciendo novedades producto de ese trabajo.

¿Habrá otro en 2011? No es seguro, aunque espero que Juan Paulo y Jacob se animen a seguir; cuentan desde siempre con mi apoyo 🙂

Otro buen experimento con Twitter

Parte de la visualización que ofrece CNN basado en los tweets de los aficionados
Parte de la visualización que ofrece CNN basado en los tweets de los aficionados

Gracias al Mundial han estado pasando buenas cosas en los medios.

Ahora de la mano de CNN.com llega otro ejemplo de un interesante uso de contenidos digitales, destacado en varios blogs, esta vez para hacer un mashup que permite tomar los “tweets” que están haciendo los aficionados de todo el mundo y presentarlos mediante las banderas de sus respectivos países.

Mientras escribía esto (anoche poco antes de las 24:00) y sacaba la imagen para acompañar este post, los chilenos eran los más activos, con 60 tweets por minuto, lo que permitía que nuestra bandera fuera la más grande en la pantalla augurando con esa victoria, la que espero tenga efectivamente nuestra Roja hoy en la cancha.

Lo interesante de esta forma de trabajo y de la experiencia que se está viviendo en este y otros casos que emplean la capacidad que ofrece Twitter de acceder a los datos generados por los usuarios, es que por primera vez hay una fórmula para “oir masivamente” lo que las personas están aportando virtualmente. Por lo mismo, hay una tarea de todos los que trabajamos en contenidos digitales, por aprovechar este espacio y generar nuevas y creativas fórmulas para hacerlo. La tarea ya está dada.

Lecciones de las elecciones municipales 2008

Imagen de Cooperativa.cl con algunos ganadores de las elecciones
Imagen de Cooperativa.cl con algunos ganadores de las elecciones.

Este no es un blog político, por lo que no esperes una lección sobre política. Esta es una reflexión acerca de lo que vi en los sitios de medios de comunicación que se dedicaron a seguir la elección municipal, que se llevó a cabo este domingo 26 en todo Chile.
El primer elemento a tener en cuenta es que la inmediatez fue crucial durante la cobertura de los comicios. Todos los medios se la jugaron por tener los números y lucharon por tener las reacciones y los últimos eventos. En este sentido, encontré interesante la apuesta de Emol TV para ofrecer cobertura en video, ya que en momentos sin información -por ejemplo en la mañana del domingo- se las ingeniaron para tener algo que mostrar.
El segundo elemento fue la visualización de los datos de las votaciones para lo cual en los mejores casos se emplearon combinaciones de mapas, sistemas de gráficos e íconos. Gran parte del día, por ejemplo La Tercera se la jugó por ese recurso que si bien fue interesante, le privó de un espacio importante en la portada para mostrar su actualización.
El tercer elemento fue la organización de información. Mientras unos medios optaron por la información basada en horas -al estilo blog- otros privilegiaron el análsis. Dentro delos primeros destacó Cooperativa.cl y en los segundos, El Mostrador con columnas de opinión que claramente acertaron en explicar qué se jugaba en la elección.
Probablemente en este ámbito fue donde estuvo uno de los elementos “al debe” y consistió en que pocas veces en el tráfago de información del día, se lograba entender qué era lo importante entre tanta noticia urgente.
El cuarto elemento fue la capacidad de explicación, que va muy asociado con lo anterior. Se refiere a que en ninguno de los sitios, por ejemplo, logré encontrar una explicación simple y directa de cómo era el procedimiento para elegir concejales. De hecho, intentar entender la ley que regula ese procedimiento costaba incluso más que encontrarla.
El quinto y último elemento de este análisis es que me quedé con la sensación de que los medios no fueron capaces de competir con la información oficial. Si bien era natural que fueran un poco atrás en la entrega de datos respecto del sitio oficial, porque no podían estar adelante de esos datos, perdieron ciertas oportunidades de informar mejor. Por ejemplo, donde el sitio oficial decía Independientes Lista A, el sitio del medio debería haberme explicado quiénes eran ellos. ¿De la Alianza? ¿De la Concertación? ¿Ninguna de las anteriores? No servía el dato solo. Lo mismo cuando en las listas de las votaciones salían los nombres de los candidatos… ¿Alguno de ellos era especial? ¿Competía por segunda vez? ¿Por tercera? ¿Era el alcalde buscando ser reelegido? De nuevo, los datos solos no ayudaban y los medios no me aportaron mucho en mi necesidad de entender.
Finalmente debo anotar algo agregando un disclaimer: trabajo en el sector público. Es lo siguiente: seguí las presentaciones de Harboe -quien daba los resultados del Gobierno- y era notable cómo al momento de decir “y a partir de este momento los resultados están disponibles en el sitio web”, efectivamente así ocurría. Sincronía pura, gracias al trabajo de la gente de Informática del Ministerio del Interior (Entre paréntesis: cuando se hable de analfabetos digitales en el Gobierno o de capacidad para desarrollar en el ámbito público, claramente hay que hacer distinciones).

La foto de este artículo pertenece al sitio Cooperativa.cl.

Descubriendo el triángulo dorado de Google

No es el lugar de Google donde guardan el dinero para comprar cosas como FeedBurner, Blogger o YouTube.
Se trata de que un estudio presentado en noviembre pero que se está comercializando por estos días, describe el “triángulo dorado” que utilizan los usuarios de los principales buscadores (Google, MSN y Yahoo!) para discriminar qué es lo que más ven cuando aparece la página de resultados del buscador. Es un triángulo formado por la parte superior en que se muestra el término buscado y el número de páginas encontradas; luego baja por la izquierda hasta el tercer o cuarto resultado que aparece sin necesidad de mover el mouse. El área cubierta por la mirada (que tiene la forma de un triángulo) es lo que existe para el usuario y lo demás, simplemente no se ve.
El trabajo, al que llegué vía una interesante reflexión de Jesús Encinar, fue realizado por Enquiro usando la metodología de Eyetools para eyetracking.
En estricto rigor se trata de la segunda versión, ya que la primera data de 2005, se refería sólo a Google y recibió muchos comentarios, incluyendo al propio Jakob Nielsen quien a partir de esos resultados, hizo su propio trabajo para luego anunciar la existencia de la forma de “F” en la visualización los contenidos.
La diferencia es que esta vez se incluyó en la investigación a Google, MSN y Yahoo!, obteniendo resultados similares: los usuarios tienen igual comportamiento en los buscadores más importantes.
Aunque sólo publica un resumen, para que uno se interese en el estudio completo (a US$ 150 la copia), las principales lecciones que se pueden obtener son:

  • Los tres buscadores analizados tienen su triángulo dorado, el que entre otras cosas está apoyado por el uso de espacios en blanco, uso de fuentes tipográficas y las proporciones de la página; gracias a esos elementos se determina dónde está lo relevante del sitio.
  • Se plantea el tema del “aroma” de la información (information scent): mientras más parecidas son las palabras que ofrece el sitio a los términos que el usuario busca, más cerca está de hacer click en la página. Esta teoría se refiere a que tal como los animales buscan la comida por el olfato, los usuarios buscan la información a través de su parecido en cuanto a significado.
  • Rapidez de uso: se descubre que el usuario no pasa más de 8 a 10 segundos en una búsqueda; si no encuentra, sigue adelante. En este aspecto el “aroma de la información” hace la diferencia entre hacer o no click a un enlace.
  • El reporte entrega información acerca de cuál posición es la mejor, si uno desea comprar avisos en Google. De acuerdo al artículo de Encinar, la primera no es la mejor.
  • El reporte ratifica la ceguera de los usuarios a los avisos gráficos (banners), tema que ya había sido establecido en otros similares.

Si tuviera el dinero, de más que lo compraba. No está de más en todo caso preguntar si entre la audiencia… ¿alguien se anima a financiarlo?. Yo le ayudo a leer 🙂

Links y Snap: el viaje y el destino

Por algunos días mantuve activado el servicio Snap en este sitio. Se trataba de una funcionalidad que permite que cada vez que haya un link o enlace, aparezca una ventanita con la imagen del sitio a visitar. En los mismos días y no relacionado conmigo, El Francotirador manifestó sus aprensiones con este producto. El Diablo en los detalles, respondió a ellas y pidió a Nelson que se pronunciara, quien lo hizo con su claridad habitual.
¿Resultado? Adiós Snap en mi sitio. ¿Razones? Primero, creo que uno llega a un sitio web para ver lo que hay allí (ese es mi destino) y no sólo para entusiasmarse con el siguiente sitio -que es la especialidad de Snap- y por lo tanto, sentir que lo que se ve es sólo un hito más del camino. El segundo resultado, es que me preocuparé de agregar el elemento “title” a mis enlaces, para dar más información textual de por qué lo agrego.