La búsqueda semántica y lógica de la información


Introducción

La información es tal vez el arma más poderosa de nuestros días. Desde que comenzamos el día hasta que lo terminamos, recibimos un constante bombardeo de información desde cualquier posible fuente de información. Pero no sólo nos limitamos a recibirla de forma pasiva, sino que solicitamos también información lo más precisa y exacta, deseando recibir una respuesta en el menor tiempo posible.

Hasta no hace pocos años debíamos acudir a grandes bibliotecas especializadas y especificas de los temas sobre los que queríamos hacer una consulta para recibir información. Hoy esto parece algo poco común y en decadencia debido a que la mayoría de las veces resulta un método costoso en tiempo y no siempre se puede contrastar un gran volumen de información para obtener la fuente de mayor calidad.

En su lugar se utilizan métodos alternativos de consulta mucho mas rápidos basados en una gran red de información llamada Internet. Dicha red de información, a menudo saturada de sobre información, no resultaría tal útil u organizada sin la labor realizada por los buscadores.

Los buscadores semánticos y lógicos

La mayor revolución de la información ha sido aprovechada por las empresas tecnológicas que han sabido aplicar la demanda de consultas sobre conocimientos e información de los usuarios, para crear grandes motores de búsqueda basados en criterios y formas muy específicas en las que no todos ellos funcionan de la misma manera.

Las herramientas de búsqueda en Internet proporcionan métodos simples y eficientes basados fundamentalmente en búsqueda léxica. Un buscador es un sistema que utiliza la información semántica disponible en una base de conocimiento, permitiendo capturar la estructura compleja de la información y proporcionando la capacidad de razonamiento[1]

Las herramientas de búsqueda no serían muy útiles, sin las posibilidades de consulta que dispone el usuario, es decir “las distintas técnicas y herramientas que puede utilizar el usuario con el fin de localizar la información que necesita en la Red haciendouso de buscadores [2]

Asimismo, las técnicas a menudo se basan en operadores de la lógica booleana, quizás la característica más útil para definir criterios de búsqueda sobre la lógica del motor de búsqueda. Algunos pueden ser: AND, OR, NOT, AND NOT (en algunos motores), etc.

Ejemplo de búsqueda: profesores OR alumnos en Ciudad Real

También son utilizados muchos operadores matemáticos, aunque a menudo estos operadores están disponibles para el usuario, no suelen ser cómodos o no mantienen un valor usabilidad para el usuario medio por lo que se acude a una lógica booleana limitada o camuflada dejando los operadores y expresiones más complejas para usuarios más avanzados. Por ejemplo, algunos buscadores ofrecen lógica booleana limitada con botones de elección o menús desplegables, como:

Los documentos deben incluir “Todos los términos” (equivalente a usar el operador AND entre todos los términos).

Los documentos deben incluir “Cualquier término” (equivalente a usar OR entre todos los términos).

Sin embargo, pueden construirse consultas muy complejas para recibir una información concisa y exacta que la lógica booleana limitada en los interfaces no puede ofrecer. Por ejemplo, si quisiéramos encontrar “una” (teniendo en cuenta el termino una) tienda de deportes (donde no se tuviera en cuenta supermercados) o un centro del corte ingles (comparando solo con corte) de una ciudad cualquiera y se mostrara la versión en cache del buscador para agilizar la búsqueda, tendríamos una consulta avanzada del tipo:

cache: una + “tienda de deportes” -supermercado | corte -ingles de la ciudad *[3]

La biblioteca de la Universidad de California en Berkeley tiene una excelente tabla (en inglés) que detalla qué posibilidades de operadores lógicos de búsqueda que se ofrecen en los motores de búsqueda más poderosos, así como enlaces a instrucciones que detallan cómo usar un motor específico (los enlaces están en la parte superior de la tabla)[4]

La web semántica y los buscadores de información

Este tipo de consultas no sería posible si la red no dispusiera de una estructura semántica. A esto se le conoce como Web semántica.

El objetivo del proyecto de la Web Semántica es que toda esta información sea comprensible no sólo por humanos, sino también por computadoras. Para conseguir esto se deberá codificar la semántica de los documentos web mediante lenguajes de metadatos y ontologías (representaciones compartidas de conocimiento en forma de taxonomías de conceptos relacionales y reglas de inferencia)[5][6]

Esta estructura permite componer a los documentos y archivos de la red de unos metadatos con los que aplicando la lógica se puede extraer automáticamente conclusiones de la información almacenada y hacer búsquedas de la información muy especializadas.

Actualmente el buscador más destacado y con mayor cuota de mercado, llamado Google, ha conseguido su liderazgo en el sector debido a las aplicaciones de la lógica en sus algoritmos de búsqueda de información.

Google para mejorar y acotar sus resultados recurre a utilizar truncados, operadores booleanos, o instrucciones y campos específicos para obtener la información que se precisa. Pero su gran potencial reside en la utilización de la teoría de la lógica difusa[7] desarrollada por iraní Lofti Zadeh[8] que se basa en superar la ley del tercer excluido[9] que propone que un supuesto solo podrá ser Verdadero o Falso y el intermedio entre ambos es descartado de forma automática, siendo esta una de las base del lenguaje binario establecido mediante instrucciones que utilizan únicamente el 0 y el 1.

Por tanto, la lógica difusa utilizada en buscadores como Google crea una forma de transcribir matemáticamente como funciona el razonamiento humano e implantar esta forma “más lógica” de pensar en las máquinas y en las herramientas concretas de búsqueda de información como los buscadores de Internet.

Conclusiones

El crecimiento de la información aumenta casi de manera exponencial cada día y la mayoría generado en Internet. Buscadores como Google ayudan a gestionar eficientes consultas de grandes volúmenes de información acotando la búsqueda a unos pocos resultados de la mayor relevancia. Para estos resultados, la lógica difusa desempeña un gran papel a la hora de la implementación de los algoritmos que a su vez se nutre de un gran volumen de metadatos pertenecientes a la web semántica.

La información y la meta información adquiere notablemente más importancia y posiblemente en un futuro seamos capaces de “hablar” con máquinas de una forma más humana, gracias a la lógica y sus aplicaciones para realizar nuestras búsquedas con un simple esfuerzo.

Bibliografía

[1] CERN. European Laboratory for Particle Physics & others; TWebS: An Application of Terminological Logics in Web Searching. Granada Editorial S.N, 1999

[2] Agustín Montes Hernández; Posibilidades de consulta en los buscadores, Marzo 1999

http://www.elprofesionaldelainformacion.com/contenidos/1999/marzo/posibilidades_de_consulta_en_los_buscadores.html

[3] Galinus; Operadores y otras formas de utilizar Google

http://www.galinus.com/es/articulos/operadores-y-comandos-google.html

[5] Yusef Hassan Montero; Web Semántica: El papel del Arquitecto de la Información, 28 de Abril de 2003

http://www.nosolousabilidad.com/articulos/web_semantica.htm

[6] Peis, E.; Herrera-Viedma,E.; Hassan Y. and Herrera, J.C. Ontologías, taxonomías y agentes: recuperación “semántica” de la información. JOTRI 2003: II Jornadas de Tratamiento y Recuperación de Información, 8 y 9 de septiembre de 2003

[8] Wikipedia inglesa; Lotfi Zade; http://en.wikipedia.org/wiki/Lotfi_Zadeh


Deja un comentario