viernes, 21 de mayo de 2010

En defensa de la Web Semántica


Ya en 1989, Berners-Lee, el creador de Internet, adelantó el concepto que más adelante se conocería como Web semántica: una extensión de la actual Web cuyo objetivo es que no sólo los humanos, sino también las máquinas, sean capaces de “comprender” el contenido de los documentos. Gracias a la Web semántica, el usuario podría interrogar a un agente software que realizaría tareas complejas de asociación e inferencia del conocimiento, por lo que los resultados que se devolverían al usuario serían precisos y contextualizados, ahorrando tiempo y evitando problemas de "ruido" y "silencio" documental y, lo que es más importante, brindando al usuario exactamente la información que necesita.

Sin embargo, este proyecto no ha tenido el éxito esperado. Algunas razones por las que no lo han tenido tienen que ver con el aspecto meramente tecnológico de su implantación, ya que precisa de lenguajes de codificación aún poco desarrollados como el RDF y XML, todavía en proceso de creación. Aun así, creemos que el problema principal al que esta nueva forma de comprender Internet se enfrenta es la poca confianza que despierta entre usuarios potenciales y entre profesionales.

Se critica el hecho de que la Web semántica se parece demasiado al conceptio de "inteligencia artifical"... como si el hecho de implantar este nuevo lenguaje de codificación implicara el uso de super-ordenadores casi cercanos a la robótica. Nada más lejos de la realidad: cabe recordar que esta crítica también se hizo a muchos otros proyectos que hace unas décadas parecían casi de ciencia-ficción, y hoy se utilizan a diario, como el propio Internet.

Actualmente, se están realizando distintas propuestas para conseguir una mayor usabilidad de los documentos semánticos, obtener una mayor implicación de los usuarios y suministrarles recursos que les ayuden a mejorar la localización y el grado de popularidad de los contenidos. Nadie ha puesto el grito en el cielo ni ha creído que nos acercamos a una era de súper-ordenadores, precisamente porque es algo a lo que la mayor parte de la población ya hace varios años que tiene acceso y lo ve como una herramienta necesaria para sus gestiones habituales. El siguiente paso bien podría ser la Web semántica, si se consiguiese que los usuarios vieran este proyecto con la normalidad y la naturalidad con el que ven el Internet de ahora.

La única forma de popularizar la Web semántica y facilitar su posterior implantación es aproximarlo a la Web social, para implicar a los usuarios en la creación y gestión de documentos semánticos. Para hacer más sencilla la participación de los usuarios en la creación de la Web semántica es preciso crear herramientas sencillas y amigables, que animen a los usuarios a dejar de lado el HTML a pesar de su mayor sencillez.

Una opción sumamente interesante en esta dirección son los enfoques híbridos que combinan ambas tendencias, el uso del Internet "tradicional" y el nuevo enfoque semántico. Un ejemplo es Piggy Bank. Se trata de una aplicación que captura localmente las etiquetas de los RDF visitados, para organizarlos en una ontología local, y que puede ser compartida en el Semantic Bank. Esta herramienta permite poner tags a las URL seleccionadas para recuperarlas posteriormente. Un proyecto parecido a este es Annotea, de W3C, que se puede instalar mediante un plug-in en Firefox denominado Annozilla. Ambas aproximaciones, sin embargo, tiene la problemática inherente a los tags: la sinonimia y la polisemia... algo inherente al Internet tradicional.

En conclusión, podemos decir que la Web semántica es una opción muy válida para hacer frente a los problemas clásicos de Internet, que pasan por tener que tratar un gran volumen de información de todo tipo de publicaciones y dirigida a un público heterogéneo. Además, los usuarios y las aplicaciones informáticas precisan de un mayor contenido semántico para dar mayor funcionalidad a la Web. Para hacer frente a esta problemática se han desarrollado herramientas de procesamiento del lenguaje natural, se han incorporado herramientas estadísticas y se han creado recursos terminológicos para dotar a los recursos de una semántica adicional.

Pero hay que tener en cuenta que estas herramientas, a pesar de su utilidad, no son suficientes para hacer frente a los problemas que plantea Internet a la hora de recuperar la información. La Web tradicional, es decir, la Web 2.0, ha logrado un mayor éxito dada su cercanía al usuairo y su mayor simplicidad, pero tiene el inconveniento de no poder subsanar problemas de interoperabilidad, sinonimia y polisemia. La Web semántica, por el contrario, es el sistema perfecto para dar un paso adelante en la recuperación de la información, a pesar de su poca legibilidad y mayor complejidad, y por ello merece una oportunidad por parte de la comunidad científica y profesional, así como de los usuarios de Internet.

No hay comentarios:

Publicar un comentario

Agradezco cualquier colaboración, pero tened en cuenta que los mensajes como spam o de contenido ilegal u ofensivo serán eliminados.