divagaciones sobre la web semántica

Hace poco me preguntaban acerca de la web semántica de la cual tanto se habla en blogs, foros y esquinas geeks. Haciendo referencia al subtítulo de este blog (… anotaciones personales…), intentaré resumir escribiendo mis ideas divagando un poco.
La Web semántica es una Web con un mayor significado y no propiamente por la información neta que se presenta (contenidos de un website), sino por la forma y estructura en la cual la información es presentada a sistemas (siendo éste un software capaz de leerla, interpretarla, procesarla y compartirla con otros sistemas).
El funcionamiento de la web no semántica a día de hoy (y centrándome en la relación buscadores/usuarios) podría definirse como:
- Millones de usuarios con poca precisión en sus consultas realizadas
- Mucha información redundante, basura, sensible al vocabulario y fácilmente indexable
- Mucha información de calidad, no clasificada (o no etiquetada) no siempre indexable por lo tanto no de fácil acceso
- Pocos sistemas capaces de indexar e interpretar información y responder a consultas avanzadas de usuarios
- Poca interacción datos - sistemas - usuarios
- Capacidad de indexar muchos datos, pero poca información y escaso conocimiento.
La web semántica mejoraría los anteriores ítems en lo siguiente:
- Los sistemas software serían capaces de interpetar el significado de los datos, por lo tanto capaces de procesar e interpretar información y proporcionar conocimiento
- Interoperatividad entre sistemas distribuidos
- Búsquedas potencialmente más específicas
En definitiva, mayor éxito en la búsqueda de información para el usuario.
Profundizando un poco en el concepto de “web semántica”, podemos decir que su objetivo es llegar a convertir a la Web en una “gran base de datos distribuida” ofreciendo:
- Información clasificada
- Jerarquía en los datos
- Metadatos de los datos
También es verdad que personalmente veo dos profundidades alcanzables en el concepto de Web semántica:
Un primer nivel: correcta sintaxis (x)html
El nivel más superficial que veo, es aquel donde nos encontramos con una Web semántica en lo referente al correcto uso de las etiquetas (x)HTML. No sólo a una correcta sintaxis validándo el código, sino utilizándo las etiquetas semánticamente idóneas, como por ejemplo:
- H1,H2, H3, H4, H5, H6: correctamente jerárquizados para títulos encabezados
- P: para párrafos de textos
- UL, OL: Para listas de elementos, como por ejemplo un menú de links
- STRONG, EM: para resaltar o enfatizar partes de textos
- CITE, ABBR, ACRONYM, CODE, DEL, INS, LABEL .. etc: dependiendo de qué tipo de texto sea para darle valor semántico según lo que representen en el contexto real.
- Proporcionar textos alternativos o complementarios a imágenes, tablas, deficiones
- Escribiendo un código semánticamente correcto como podría ser:
<h1 class="titular">Películas</h1> <div class="pelicula"> <h2 class="titulo">Extraño Suceso</h2> <span class="director">Terence Fisher, Antony Darnborough</span> <span class="fecha">1950</span> <span class="duracion">86 min</span></div>
Sería como poder averiguar parcialmente la estructura de la base de datos a partir de una simple observación del código html de una págin generada dinámicamente con datos de una base de datos. Viendo el código anterior, (y partiendo de que se trata de una web dinámica con base de datos) podríamos afirmar ciertos campos de la supuesta tabla “películas” como {titulo, director, fecha, duración…}. ¡Exacto! Un buen indicador de que una web ha sido maquetada semánticamente correcta sería aquella que aproximadamente dejase entrever su estructura de la base de datos.
Un segundo nivel: tecnologías…
Referente a la forma de ofrecer información de forma que sea “tratable”, es decir, leída y procesada por sistemas intercomunicados. Aquí es donde intervienen tecnologías como RDF, XML Schemas, OWL y conceptos como ontologías, microformatos los cuales salen del objetivo de este post.
Referencias para ampliar información:
- Guía breve sobre la Web semántica [del w3c.es] (en español)
- Resumen interesante [web-semantica.org] (en español)
- Especificación RDF en español
- Introducción a la web semántica [w3.org] (en inglés)
- Metadatos de Dublin Core (en inglés)
- Sobre microformatos (en inglés)