Archivo de la etiqueta: Web semántica

Temas relacionados con la Web semántica.

Google ya lo dijo: se viene la semántica

No es muy público ni ha llegado a los grandes titulares, pero para quienes trabajamos en contenidos digitales es una de las noticias importantes: Google apostó por lo semántico.

La nota en la que se anunció formalmente apareció en The Wall Street Journal hace un mes, incluyendo las declaraciones de Amit Singhal, uno de los científicos de Google dedicados a la búsqueda.

Allí plantea que se vienen años diferentes para su propio buscador, ya que además de mostrar resultados tal como lo hace ahora, debe establecer relaciones entre las páginas que se destacan, hasta llegar a un momento en que responda tal como una persona. Es decir, y tal como se plantea en esa nota de prensa:

Para una pregunta compleja tal como “¿cuáles son los 10 lagos más grandes de California?” Google podría entregar una respuesta en lugar de sólo mostrar enlaces hacia otros sitios.

Esto significa varias cosas, entre las cuales aparece la idea de que hay una máquina que entiende el significado los contenidos, más allá de que sólo se da cuenta de las palabras que ellos incluyen, como es en la actualidad. De allí que a esto se le llame “semántico”.

Como la publicación en WSJ es un anuncio concreto de lo que viene, ya hay muchos que se están preparando, ya que si bien es algo que va a tomar tiempo para que se concrete, es claro que Google (y los demás buscadores) seguirán indexando sitios y que, cada vez, buscarán más datos. Ya no sólo los que se muestran en el sitio, sino también los metadatos, que son aquellos que dan contexto a la información que se ofrece.

Entonces, si uno se dedica a crear contenidos digitales, cuáles son las tareas que aparecen y de qué nuevas hay que preocuparse? Acá enumeramos algunas:

  • Fin al SEO como lo conocemos: ya no serán tan relevantes las estrategias de mejoras de páginas tradicionales para subir en los buscadores, ya que éstos se fijarán en el contenido, más que en la forma. Habrá que darle más énfasis al contenido.
  • Contenido de calidad: lo que se buscará a futuro es contenido que efectivamente dé respuestas a lo que la gente busca. Por ello, habrá que tener un foco más puesto en la calidad que en la cantidad, ya que éso andarán buscando los robots que indexan.
  • Google’s Knowledge Graph: esta es una base de relaciones entre elementos que Google adquirió junto con la empresa Freebase y se asume que será la base desde la cual, a partir de ahora, establecerá cuáles son los sitios mejor relacionados, para determinados contenidos. Entender cómo opera, ayudará a saber lo que viene.
  • Aprender de web semántica: una forma de hacerlo, es mirar las presentaciones que ha hecho Claudio Gutiérrez, profesor de la U. de Chile y uno de los más avanzados en el tema en el país. Asimismo, leer los posts de Álvaro Graves, en los que explica qué hacer con linked data.

Preguntas (y respuestas) sobre Web Semántica

Juan Carlos Camus conversando con Daniel Fajardo en el Webinar de Web Semántica
Juan Carlos Camus conversando con Daniel Fajardo en el Webinar de Web Semántica

Una interesante oportunidad de ofrecer una par de explicaciones básicas acerca de la web semántica, tuve este jueves en el webinar organizado por el programa Líderes Digitales que lleva a cabo la consultora Antroponet.

En 30 minutos intenté dar mi mejor explicación acerca de esta nueva forma de organizar y ofrecer información, que busca de dotar de significado a los datos que se presentan vía web. La intención es que la web que “ven” las personas tenga una dimensión adicional adicional a través de etiquetas especiales, que permita a los computadores y sus software comprender de qué se trata el contenido que ofrecen.

En la conversación ofrecí dos cosas, que aprovecho de complementar en este post. Lo primero fueron algunos enlaces interesantes para comenzar a investigar y que fueron los siguientes:

  • El artículo original de Tim Berners-Lee que describe el concepto de la web semántica, publicado en 2001 por Scientific American (PDF, en inglés).
  • El buen artículo de Ignacio Rodríguez que explica los elementos básicos de la web semántica.
  • El buscador semántico Hakia.com, uno de los primeros en abordar el problema de buscar en este ámbito. En esta búsqueda responde quién es el dueño de los derechos de autor de la canción Feliz Cumpleaños (en inglés).
  • Un artículo de Tim Berners-Lee que ayuda a entender el concepto de las etiquetas que se agregan a una página web, para avanzar hacia lo semántico.
  • El sitio Opendata.cl que reúne a gente que está trabajando en este tema.

En forma adicional, al final de la entrevista, ofrecí responder las preguntas que no alcanzamos a abordar. Estas son las siguientes (me llegaron sin el autor):

1.- Yo trabajo en el área turismo ¿Qué me recomendarías hacer con la web semántica al respecto?

Comenzar por investigar lo que se está haciendo afuera en esta área; hay muchas oportunidades por ser el primero. A futuro habrá necesidad de que haya información de ciudades y atractivos con etiquetas semánticas. Comenzar antes será una ventaja.

2.- Hay alguien en Chile que realmente esté haciendo aplicaciones semánticas?

Ya comenzó especialmente en universidades (por ejemplo en la U); no conozco aplicaciones como tales, pero creo que es cuestión de tiempo.

3.- Wikipedia sería el primer portal que se acerca a lo semántico?

En torno a Wikipedia se está trabajando lo semántico. Como referencia hay que mirar este artículo.

4.- ¿Está bien que a la web semántica también se le diga web 3.0 ”?

Las denominaciones con números tienen más que ver con el marketing asociado a la tecnología que a una numeración real. La web semántica, por ejemplo, fue descrita ya en el 1998, mucho antes de que se comenzara a hablar de la web 2.0. Personalmente prefiero el nombre 2semántico” porque es más preciso.

5.- ¿Y qué viene después de la web semántica?

Se habla mucho de la web como sistema operativo, aprovechando el “cloud computing” y la capacidad de conexión en todo lugar. Eso, mezclado con aplicaciones semánticas, debería dar mucha potencia a una Internet ubicua. Habrá que esperar para ver.

Un mundo con disclaimers

En los últimos días he seguido estudiando temas de web semántica, aprendiendo e investigando, más que trabajando en el tema. Por lo mismo, me he comenzado a imaginar posibilidades y futuras aplicaciones de esta forma de administrar y ofrecer información.
Conversando con un colega, descubrimos que una aplicación normal cuando la web “sea” semántica, será vincular datos de manera tal que se podrá avanzar a través de ellos gracias a las vinculaciones que tendrán.
En este sentido, lo que se haga en estos años en cuanto a “enlazar datos“, que es la forma de trabajo en la que se basa la web semántica, será clave para conseguir ese resultado.
Dándole una vuelta de tuerca a esta idea, en ese mundo de datos enlazados, será más fácil llegar a información que habitualmente está oculta por falta de acceso o publicidad de la misma. Y, por lo mismo, todos deberemos ofrecer “disclaimers” mucho más seguido porque los eventuales conflictos serán descubiertos más fácilmente. Estarán a un click de distancia.
Además, porque imagino que en ese mundo de “más” información, las empresas estarán más disponibles para ofrecer más datos acerca de ellas mismas y de sus operaciones. Un ejemplo por adelantado, es el que está dando Google con su información acerca de lo que los gobiernos del mundo le piden respecto de los resultados de su buscador.
La política fue lanzada ayer y el sitio inicial para informar del tema ya representa la manera en que la información será entregada en el futuro: simple, directa y fácil de usar. Me gustaría agregar que es detallada, pero asumo que eso vendrá con el tiempo.

El mapa del mundo con los datos de los países que han pedido cambios a Google
LEl mapa del mundo con los datos de los países que han pedido cambios a Google.

Creo que la promesa de la web semántica es amplia y dependerá de lo que hagamos y desarrollemos, la manera en que podrá cumplirla.

Avanzando hacia la web semántica

Llevo ya algún tiempo leyendo y estudiando acerca de temas que en términos generales se conocen como “web semántica”. Aunque del tema he escrito antes en este blog, la novedad viene de que por primera vez me tocará trabajar en un proyecto que utiliza esta tecnología.
Así que espero ir compartiendo por esta vía los resultados, ya que vía Twitter me he dado cuenta que hay muchos interesados en el tema.
Para quienes no están interiorizados en el tema y para explicarlo de manera simple, la web semántica es la siguiente etapa de los sitios web, en la que el contenido tiene en forma simultánea, una versión para humanos y una para máquinas. La gracia es que la segunda, enlaza los datos presentados para que cualquier máquina que los lea, los pueda utilizar de manera expedita y simple. A esto se le conoce como “datos enlazados” (del inglés linked data, de acuerdo a lo que definió hace ya un tiempo Sir Tim Berners-Lee, el creador de la web).
Lo primero que debo indicar, es que la mayor parte de la información está en idioma inglés, por lo que no queda otra que citar esos documentos (a mis alumnos siempre les reitero lo importante que es leer y entender inglés).
Para comenzar les quiero dejar una presentación hecha por el colombiano Juan Sequeda en la última convención internacional del tema realizada en EE.UU. en octubre pasado, que tiene la gracia de explicar de manera sencilla de qué estamos hablando. Él estudia su doctorado en el tema, por lo que es bueno saber de él (le seguiremos la pista).

Y para terminar, les dejo el documento base de este tema, titulado How to Publish Linked Data on the Web, que aborda los principales temas a tener en cuenta al trabajar en esta área.
Hay mucho para estudiar y aprender, así que esto se ve entretenido.

¿Cómo se le gana a Google?

El buscador Cuil.com
El buscador Cuil.com.

Durante todo el día he estado leyendo posts relativos al nuevo buscador llamado “Cuil” que fue presentado hoy, nada más y nada menos como una alternativa naciente al gigante Google. Como antecedente que le da credibilidad a su pretensión está el hecho de que cuenta entre sus ingenieros, a un grupo de ex-googlers que habían desempeñado cargos de relevancia en esa empresa, ligados a la búsqueda.
Sin embargo, las primeras evaluaciones no han sido buenas ya que la verdad sea dicha, en la búsqueda no es tan rápido y en los resultados no es tan preciso. Tanto en inglés como en castellano, lo que se ha dicho es poco grato para el recién llegado.
En mi caso, de tanto en tanto, pruebo nuevos buscadores y ya en el pasado me cambié de Yahoo a Altavista y desde allí a Google, por ejemplo. Por lo mismo, me declaro dispuesto a seguir moviéndome de buscador si encontrara uno mejor. Pero aún no es el caso, porque creo que no se han cumplido las condiciones mínimas, que son las siguientes:

  • Que en la búsqueda aparezca el contexto, para que sea fácil elegir el área en la que me interesa buscar. Esto ya lo había dicho en un post previo y siento que la web semántica ayudará a conseguirlo.
  • Que el nuevo buscador sea tan rápido y ofrezca tantos resultados como los que Google entrega, incorporando tantas fuentes (blogs y otros sitios sociales) como sea posible.
  • Que esté tan diseminado como Google; dado que ese buscador está, por ejemplo, en mi browser, ya ni siquiera tengo que ir a su sitio para usarlo. El se aparece en los lugares en los que yo estoy usando la aplicación.

Estos son tres razones. De seguro, hay más y el propio Google ha dado pruebas de que está buscando la forma de atenderlas para evitar que yo -y millones similares- nos cambiemos de buscador.

La web semántica conquista adeptos y gana futuro

Desde que en la edición de mayo de 2001 de la revista Scientific American Magazine publicara un artículo sobre la web semántica con la firma de Tim Berners-Lee, el mundo científico supo que algo más grande que el web estaba naciendo.
Lo que no estaba claro entonces, es que ese nuevo invento se tomaría tanto tiempo en estar listo.
Sin embargo, noticias recientes parecen estar dándole la razón a Sir Tim, ya que en las últimas semanas hay varios creadores de contenido ubicados entre los más importantes del mundo, que han anunciado su apoyo a esta nueva forma de trabajo. Reuters anunció la creación de una API para manejar los contenidos bajo los conceptos de la web semántica y ha ofrecido un premio de US$ 5 mil para quien lo implemente para WordPress. Yahoo! en tanto anunció soporte de estándares de web semántica para sus búsquedas, lo que permitirá el uso de contenidos más estructurados y útiles para agregar contenidos.
Por último, ZDNet le abrió las puertas a Paul Miller, para que evangelizara sobre el tema desde un blog. Y como su primer invitado tuvo a Berners-Lee, logrando una enciclopédica conversación que permite entender de qué estamos hablando (transcripciónpodcast).
Y, de verdad, ¿de qué hablamos cuando decimos web semántica?
Muchos simplemente la han tildado de Web 3.0 para evidenciar que es lo que viene ahora, si hacer mucho caso a sus características. Pese a que suene a denominación de marketing, me gusta porque representa la aparición de algo diferente a lo conocido. Mientras la Web 2.0 ponía su énfasis en la interacción entre los usuarios y el sitio web, la web semántica se orienta casi exclusivamente a la calidad del contenido y a la capacidad de que éste sea descrito usando estándares que permitan a programas computacionales entender lo que está escrito.
Hacia adelante, lo que se busca es que haya máquinas que se intercambien datos basados en su contenido, ya que éste podrá ser distribuido gracias a estándares como RDF.
Naturalmente que hay mucho más que explicar, pero lo dicho me parece una buena aproximación.

PD: Gracias a FT por animarme a tomar el tema.

Web 3.0: tiempo de definiciones

Aún cuando la Web 2.0 no se enfría sino que es tema de debate y trabajo arduo, ya hay algunos interesados en abrir un espacio para la siguiente: Web 3.0.
Leyendo, me he encontrado varias definiciones sobre cuál es su alcance y definición, que dejo acá a la mano, para que veamos que no todos están entendiendo lo mismo… o tambien, para que nos enteremos cómo convergen las ideas para llegar a una definición más certera del tema:

  • Eric Schmidt de Google la define como la “suma de pequeñas aplicaciones que pueden correr en cualquier dispositivo, que son rápidas y customizables y pueden ser distribuidas de manera viral”.
  • Tim Berners-Lee, creador del Web y el HTML, lleva algunos años hablando de la web semántica que permite que los computadores entiendan el significado de las páginas web que ellos mismos almacenan y que incluso, logren crear contenidos a partir de esa comprensión. Hay quienes dicen que ésa es la Web 3.0.
  • Pablo Mancini plantea que es una nueva forma de interacción, especialmente en espacios creados virtuales creados en el computador, como por ejemplo, Second Life.
  • Por último, Jason McCabe Calacanis acaba de sacar una interpretación del término, que él llama la definición oficial, y que dice: “Web 3.0 se define como la creación de contenido y servicios de alta calidad, producidos por personas talentosas usando tecnología Web 2.0 como la plataforma facilitadora”.

¿Con cuál de ellas te quedas?

Señales de futuro

Fue a mediados de febrero cuando un par de noticias devolvieron la fe en el papel que la tecnología cumple, cuando se trata de dar sorpresas agradables.

La primera ocurrió justo el día 14, cuando al podio desde el que se abre la jornada en la bolsa de valores “New York Stock Exchange”, accedió no sólo un grupo de personas, sino que un robot humanoide. Se trató de Asimo, el último eslabón en la investigación sobre robótica que realiza Honda. Este fue el personaje elegido para recordar los 25 años en que la compañía japonesa está listada en dicha bolsa.

Asimo no sólo camina bastante bien, sino que sube y baja escaleras de manera suave y coordinada y hasta entiende órdenes habladas, abriendo una serie de posibilidades para que estas máquinas (¿es muy reciente para llamarle ente o entidad?) comiencen a jugar papel interesante en diferentes tipos de operaciones donde, hasta ahora es imprescindible la presencia humana.

La segunda noticia llegó un par de días antes, de parte de la compañía Foveon, con el anuncio de un novedoso chip que va dentro de las cámaras fotográficas y que por primera vez permitirá que las tomas digitales sean mejores que las películas basadas en sales de plata. Dicha innovación es tan importante, que una cámara de 3.5 millones de pixeles ofrece una resolución de 7 millones de pixeles y, mejor aún, usa menos memoria para almacenar la información de una imagen.

De hecho en un show sobre fotografías que se realizó en estos días en Orlando, dicho chip, ya montado en una cámara que está saliendo a público en marzo, fue la gran novedad.

Y la tercera noticia fue la publicación de nuevos avances sobre la llamada web “semántica”, que es una tecnología que permitirá la existencia de más inteligencia en Internet, de tal manera que cuando se haga una búsqueda se consigan resultados más relevantes para quien la realiza… basados en el contenido resumido de las páginas que se escojan. Y dicho resumen será hecho por las máquinas, no por los humanos.

Como se ve, la tecnología sigue avanzado ya que ésta depende no sólo de los sistemas sobre las cuales se apoya o de los fondos para seguir investigando que la puedan mantener viva, sino que de la creatividad de las personas y de la forma en que se abordan los problemas que requieren una solución. Y siempre hay alguien con la mente abierta y pensando un poco más allá, para darnos esa sorpresa que todos llamamos “nueva tecnología”.