La relevancia de los tesauros como herramienta de control terminológico, muy útil para el análisis, descripción y recuperación informativa, deriva de las características a las que aluden sus numerosas definiciones: constituye un lenguaje controlado, (subconjunto del lenguaje natural, según la (Asociación Española de Normalización y Certificación, 1990), o del lenguaje formal de una disciplina o área específica del conocimiento, referida como dominio); postcoordinado, integrado por palabras y frases que representan contenidos, denominados descriptores, los cuales son clasificados en forma temática o facetada, que describen los contenidos semánticos del dominio, poniendo de relieve las relaciones de sinonimia, de jerarquía y otras relaciones y dependencias entre ellos (relaciones sintácticas y semánticas); y cuya función es proporcionar un vocabulario normalizado que dé consistencia a la indización (representación del contenido temático de un recurso de información) y facilite la búsqueda en los sistemas de recuperación de la información, lo que implica un doble uso que hace de puente entre la colección documental, el profesional y el usuario de la información al facilitar la coincidencia entre lenguajes. En este sentido, suelen presentar una estructura tripartita: un apartado jerárquico, en el que se presentan los descriptores en el contexto de su dominio; una parte alfabética, para facilitar la entrada en el tesauro por la primera palabra significativa de descriptores (también de no descriptores) y que expresa las relaciones del vocabulario; y un índice permutado que permite el acceso por el resto de términos significativos.
En su proceso evolutivo como herramienta de lenguaje documental, ante la automatización creciente de los últimos años y, en especial, el desarrollo de la Web, los tesauros ha ido evidenciando, por un lado, una adaptación a nuevos usos, integrándose en conjunción con el lenguaje natural en los Sistemas de Gestión de la Información (SGD) como bases de conocimiento1 con el fin de mejorar la recuperación de la información y en los sistemas de búsqueda en la red, y por otro, sus posibilidades hipertextuales a través de las relaciones para servir como elementos de navegación.
Paralelamente, como una necesidad para aprovechar las posibilidades que la tecnología ofrece y adaptarlos al medio digital, se ha ido registrando una revisión de su estructura confluyendo con las críticas expresadas sobre la debilidad o indefinición de algunos conceptos reflejados en las normas que los regulan, en relación a diversos aspectos.
En primer lugar, se apunta a que debe darse un acercamiento de la base léxica al lenguaje natural introduciendo el uso de otras categorías distintas además del sustantivo, tales como adjetivos, verbos, adverbios e incluso prefijos y desinencias, enriqueciendo así los elementos de significación, e incorporando el contexto discursivo. Asimismo, la morfología de los términos debe incorporar otras opciones, tales como número y género. En segundo lugar, se deben adoptar estructuras nuevas, más horizontales, donde se incrementa la importancia relativa de las relaciones asociativas, en detrimento de las jerárquicas que pasan a ocupar un lugar secundario, incorporando el concepto de vector como elemento básico. La estructura de este tipo de lenguaje, basada en las teorías del análisis del discurso, se articula en torno a las macrocategorías, elementos de la macroestructura, y los vectores asociativos.
En cuanto al vocabulario, se apuesta por la inclusión de otras formas léxicas distintas del sustantivo o palabras sustantivadas prohibidas en la normativa para su inclusión como descriptores, como es el caso de verbos, adjetivos o adverbios. Se incide además en la necesidad de definiciones para los términos y de reglas más concretas en relación con la actuación ante los términos compuestos, cuya utilización ha ido en aumento; en particular los del tipo sintagmático para incrementar la precisión en la recuperación.
Junto a ello, se indica que las relaciones de equivalencia entre términos pueden quedar reducidas, al agruparse todos los términos equivalentes en torno al concepto al que se alude, pudiendo éste ser accedido desde cualquiera de ellos y convirtiéndose en un auténtico nodo de una red semántica o mapa conceptual; lo que ha llevado a hablar de “tesauros conceptuales”. Esta es también la intención que guía las propuestas de tesauros de usuarios, que pretenden un diseño centrado en el usuario, acercando el lenguaje utilizado por éste al del indizador (incorporando, por tanto, premisas de la psicología cognitiva).
Por otro lado, se señala en lo relativo a las relaciones jerárquicas que, aun bien definidas, dan lugar a problemas de integración y reutilización, incluso en otros instrumentos como las redes semánticas.