Un tesauro es una lista de palabras o términos controlados, empleados para representar conceptos.
Proviene del latín thesaurus (‘tesoro’), y este a su vez del griego clásico thēsaurós (θησαυρός, ‘almacén’, ‘tesorería’). Es utilizado en literatura como thesaurus, thesauri o tesoro para referirse a los diccionarios, como por ejemplo el Tesoro de la lengua castellana o española de Sebastián de Covarrubias, de 1611.
Adquiere al menos dos significados relacionados, en el campo de la literatura y en el campo de la biblioteconomía o ciencias de la información.
En cuanto a lo jurídico, son utilizadas bases de datos los cuales se enfocan en construir sistemas de búsqueda de ordenar contenidos y generar instrumentos lingüísticos, todo esto en relación y apoyo directo por thesaurus. El mismo, se conceptualizaria como un sistema con el cual se busca la clasificación y ordenación de textos y documentos, siguiendo parámetros de jerarquía, inclusión, orden. En cuanto esto, el thesaurus opera en tres niveles:
Tesauro es una lista de palabras con significados similares sinónimos, habitualmente acompañada por otra lista de antónimos. Un ejemplo sería un tesauro dedicado a un campo especializado, que contiene la jerga que se emplea en dicho campo del conocimiento. En el mundo de habla inglesa, es clásico el Tesauro de Roget (publicado en 1852), cuya función es, según su autor, además de ayudar al escritor a encontrar la palabra que exprese mejor su pensamiento, también estimular su intelecto y sugerirle palabras o ideas relacionadas.
El conocimiento se organiza con miras a efectuar una normalización terminológica que permita mejorar el canal de acceso y comunicación entre los usuarios y las Unidades de Información (entiéndase unidad de información como: biblioteca, archivo o centro de documentación). El primer tesauro del idioma inglés, publicado en 1852, fue compilado por Peter Mark Roget. El Tesauro posee un signo de representación lingüístico, un vocabulario controlado y una sintaxis poscoordinada. Aunque en la práctica tradicional se habla de unitérminos, en la actualidad se ha efectuado grandes variaciones dando incorporación a términos o descriptores compuestos, es decir, descriptores que se componen de dos o más palabras.
Se refiere a un léxico de términos ordenados alfabéticamente que comprende el vocabulario especializado de una disciplina académica o campo de estudio, que muestra las relaciones lógicas y semánticas entre los términos, particularmente una lista de encabezados de materias o descriptores utilizados como términos preferidos para indexar la literatura del campo.
Los términos que conforman el tesauro se interrelacionan entre ellos bajo tres modalidades de relación:
Es un intermediario entre el lenguaje que encontramos en los documentos (lenguaje natural) y el que emplean los especialistas de un determinado campo del saber (lenguaje controlado). Aunque los incluye, las entradas de un tesauro no deben ser consideradas sólo como una lista de sinónimos.
En líneas generales, un tesauro comprende lo siguiente:
Se puede establecer una profundidad de la jerarquía, indicado por niveles de importancia de los niveles preferidos. A mayor profundidad, mayor especificidad.
Un descriptor es cada uno de los términos o expresiones escogidos entre un conjunto de sinónimos o cuasi sinónimos para representar (en calidad de término preferente) generalmente de manera unívoca, un concepto susceptible de aparecer con cierta frecuencia en los documentos indizables, y en las consultas que se realicen. El descriptor corresponde normalmente a la etiqueta de un concepto, y es la unidad mínima de significado que integra un tesauro o una lista de descriptores. Suele acompañarse de una nota de alcance o, menos usualmente, de una definición en los casos que el mero registro del término puede provocar problemas de ambigüedad en su interpretación. El descriptor es el término por el cual efectivamente se indizará (por eso se llama también término de indización), y por el cual se recuperarán los documentos referidos a su temática.
Se reproduce aquí parte de la sección alfabética de un tesauro impreso. Nótese que los términos preferidos están en mayúscula (en este caso, la palabra «AUTOMÓVIL»):
En la sección temática del tesauro, encontraremos agrupados los temas, habitualmente de lo más general a lo más específico:
Se debe tener en cuenta que los tesauros no tienen por qué ser completos, en el sentido de abarcar todo el conocimiento. Generalmente se limitan a un área temática específica, y desde un cierto ángulo en particular. Es así que existen innumerables tesauros específicos. Como ejemplo de estos, podemos citar el Tesauro de la Propiedad Industrial (en español), el MeSH o encabezamientos temáticos médicos (en lengua inglesa), y a Agrovoc (tesauro multilingüe de términos de agricultura).
En rigor de verdad, no es la función de un tesauro definir las palabras (esta función es propia del diccionario o el glosario). Sin embargo, muchos tesauros contienen definiciones de los términos que emplean, con el fin de que el usuario del tesauro no tenga dudas al seleccionar un término.
Se debe tener en cuenta que ha habido un gran cambio al aparecer la posibilidad de tesauros digitales, porque las jerarquías y las relaciones hacen que muchas limitaciones de los tesauros impresos hayan desaparecido. Por ejemplo, es posible buscar casi instantáneamente los términos de un tesauro usando un motor de búsqueda, o simplemente recorrer las jerarquías en línea, o también usar la función de «mapeo» al término preferido en forma automática, introduciendo el usuario el término en lenguaje natural, siendo el programa informático el que relaciona este término con la lista de términos preferidos, y realiza posteriormente la búsqueda en la base de datos empleando los términos preferidos.
Escribe un comentario o lo que quieras sobre Tesauro (directo, no tienes que registrarte)
Comentarios
(de más nuevos a más antiguos)