Miguel Garci-Gomez

Emeritus Professor

Department of Romance Studies

Duke University

 

 

EL PROYECTO

Multilingüe Genereador Automático de Rebusca

 de Concordancias e Ideas (MGARCI)

 

El sitema MGARCI presenta una herramienta automática, sofisticada y bastante precisa para la búsqueda, escrutinio y análisis de textos electrónicos en múltiples lenguas. Todos los textos presentan la misma estructura de búsqueda con procedimientos muy semejantes. El sistema está integrado por cuatro componentes principales:

 

CONCORDADOR: facilita la concordancia de todas las palabras del texto, no solo buscando las formas lingüísticas sino también los lemas, además de locuciones verbales, adverbiales, nominales y adjetivales, mostrando su concordancia en textos cortos y en todo el texto.

 

ANALIZADOR: ofrece un análisis detallado de todas las palabras reconocidas en el DRAE incluso las compuestas de sufijos, además de su definición, traducción a varios idiomas, etimología y más.

 

TESORIZADOR: facilita al lector pasar de la palabra a la idea, de la idea a la palabra, ayudándole a identificar todas la palabras del texto relacionadas son un concepto determinado.

 

AUTOMATIZACION:  permite procesar cualquier texto electrónico, con todas sus prestaciones, en cuestión de minutos, al simple clic con el cursor del ratón.

 

DESCRIPTION

 

El sistema MGARCI puede verse en su plena aplicación en las Obras completas de Miguel de Cervantes, accesible en la red informática bajo esta dirección: http://mgarci.aas.duke.edu/celestina/CERVANTES-MD/DON-QUIJOTE/index.htm

La siguiente figura presenta la página de entrada; se recomienda al lector que, si puede, trate de ir efectuando las operaciones de las instrucciones a manera que se van explicando:

 

Fig. 1

 

CONCORDADOR

Las concordancias han sido celebradas, y con razón. Como fuente magnífica para el aprendizaje y la enseñaza de lenguas, nativas y adquiridas. El sistema MGARCI tiene entre sus fines ayudar a maestros y alumnos interesados en satisfacer su curiosidad  por encontrar una palabra o una frase especial en al texto a la vez que brinda una herramienta para un estudio y análisis profundos. En su casi totalidad las concordancias suelen ofrecer una ventanita de búsqueda  en la que escribir la palabra o frase. Este sistema es mucho más visual y generoso; ofrece al usuario una serie de botones (su explicación aparece al posar el cursor de ratón sobre cada uno de ellos):

 

Fig. 2

Tras un clic en cada botón se muestra su contenido completo que el usuario podrá escribir en archivo para estudio por separado, comparación o cualquier otro fin de interés personal.  El hecho de que el diseño ofrezca tal variedad de elementos visuales, semejantes para todos los textos, logra que un sistema en sí muy complejo, llegue comprenderse y manejarse perfectamente tras unos cuantos intentos.  Los botones mostrados en segunda línea (Fig. 2), debajo el autor y título del libro, tras un clic, muestran su contenido:

    Palabras: todas las palabras del texto en orden alfabético, con su frecuencia.

    Termina en: las mismas palabras por orden alfabético de su terminación;

    Lemas: la entrada del diccionario que mostrará tras el clic todas las formas;

    Frecuencia: los lemas por orden de frecuencia;

    Apreciativos: todas las palabras con sufijos de diminutivo o aumentativo;

    Locuciones: frases hechas, adverbiales, nominales, adjetivales, proverbiales del tipo como boca de lobo, a sangre fría, etc.

    Loc. verbales: las que contienen en su enunciado un verbo inicial y que mostrarán tras el clic todas sus formas, del tipo decir entre dientes,  hacer incapié, etc.;

     Inter.: todas las expresiones interrogativas y exclamativas;

    N. propios: lista de nombres propios de personas, ciudades, ríos, etc.;

    Sin lema: lista de todas las palabras no representadas en a base de datos, entre ellas arcaísmos, solecismos, nombres propios, palabras extranjeras; por lo general palbras no recogidas en el DRAE

    Tesoro: ofrece todas las palabras del texto clasificadas en Campos semánticos (de contenido conceptual muy amplio: Reino animal) y Grupos léxicos (de contenido más limitado dentro del Campo: Mamíferos, Insectos);

    Load a Book (operativo con clave): facilita el proceso del texto tras un simple clic o si se prefiere, por partes, según se indica. Una vez procesado el texto, admite las búsquedas de las funciones explicadas. Este sistema automático procesa un libro de mediano tamaño (como de 500 KB) en unos diez minutos mientras el usuario puede trabajar en otra cosa.

 

Caja de búsqueda: en la ventanita de la línea superior el usuario puede efectuar varios tipos de búsqueda de su interés particular escribiendo:

a)                          Palabra o su inicio, que al mismo tiempo sirve para navegar a lo largo del vocabulario, por ejemplo, p, padre, etc.

b)                         Grupo fónico interno  escrito precedido y seguido de guión, -isim-, -nch-, etc.

c)                          Terminación escrita precedida de guión; -mente  -ísimamente servirá para encontrar los adverbios con esas terminaciones;

d)                         Lema se escribirá precedido de @ y servirá para encontras todas las formas que le pertenecen, incluidas las formas seguidas de pronombres enclíticos, diminutivos, aumentativos, adverbios.  Las formas aparecerán en la columna de la izquierda por orden alfabético con el lema en cabeza (Fig. 3). El lema @dar en Don Quijote, por ejemplo, mostrará más de 130 flexiones diferentes. Tras el clic en el lema, el usuario podrá apreciar en la columna de la derecha las concordancias de todas las formas por orden alfabético, y la posibilidad de la definición del diccionario; tras el clic en las formas individuales la concordancia se limitará a tal forma.  El lema, en cabeza, va seguido de un enlace con Tesoro, que le permitirá al lector pasar de la palabra a la idea, con lo que podrá comprobar qué otros lemas en el texto pertenecen a los mimos Campos semánticos y Grupos léxicos que le lema de interés;

 

e)                          Combinación de palabras:  además de palabras indivuduales, el usuario podrá buscar varias palabras en proximidad escribiéndolas  unidas por el signo + ;  por ejmplo, gracias+regalo podría como resultado gracias por tan precioso regalo;  se facilita también la búsqueda por lema + palabra e, incluso, lema + lema, por ejemplo @tener+ganas podría encontrar tengo (tenemos, tenían …) muchas ganas …; @gustar+@ir podría producir me gustaría haber ido. Este tipo de búsqueda es sensitivo a mayúsculas y minúsculas, de manera que Caballero+Figura reproducirá en Don Quijote la combinación Caballero de la Triste Figura.

 

Fig. 3

 

La concordancia de la columna de la derecha va seguida, en todos los tipos de búsqueda, de la información del autor y título del libro, su localización en el texto ( por ejemplo, Parte, Capítulo) y, de existir, como en DQ, de enlace con la edición Princeps.  Tras el clic, la imagen de esta edición aparecerá en paralelo con el texto de la edición moderna, permitiendo así al lector  comparar las dos versiones. La palabra de interés aparecerá iluminada para guiar al lector a hallarla en la imagen como puede apreciarse en Fig. 4 con la palabra abad:

 

Fig. 4

 

El sistema MGARCI está capacitado para detectar y mostrar las notas al texo y la traducción bilingüe, en textos paralelos, si la edición las lleva (DQ lleva múltiples notas y traducción a cuatro idiomas). El clic en la localización de la concordancia genera en la misma columna el contexto más amplio (Fig.4), con la palabra de interés iluminada, en este caso da. De haber notas al texto (n sobrescrita) aparecerán en la columna de la izquierda. Cada párrafo en el texto, como se indica en Fig. 5, lleva un enlace (T soberscrito) a su traducción al inglés en DQ.

 

Fig. 5

 

Desde esa traducción, con el clic en T, el lector puede enlazar, como viene indicado en Fig. 6, con las traducciones al alemán (AL), francés (FR) o italiano (IT); he aquí un ejemplo de la traducción al inglés:

 

Fig.6

 

Este concordador, como se viene explicando, ofrece muchas prestaciones para un estudio en profundidad del estilo, el arte de la expresión peculiar y característica de un escritor.

Por ejemplo, ayudará al lector a discernir en un texto determinado

a)                          Los méritos estilísticos de la frecuencia o rareza del uso de adjetivos, adverbios, exclamaciones, frases hechas,  expresiones de relleno, etc.;

b)                          Los efectos emotivos de exclamaciones, preguntas, etc.;

c)                          La rotundidad de expresión del autor en su frecuente uso de nunca, siempre, todo, nada,  nadie, en absoluto, completamente, sin duda, estoy seguro, y otros, frente a una actitud más recatada que prodra reflejarse en posiblemente, quizás, creer, ocurrírsele, opinar, etc.;

d)                         Apreciativos: Mientras que en el francés y el inglés los sufijos apreciativos son relativamente raros y sirven para indicar tamaño o importancia en mayor o menor grado de lo normal, son abundantes y variados en el español, con los que se intensifica el significado de la palabra base  (ahora mismito), o se expresan emociones de cariño (mamita), o de ternura (hijito), ridiculez (regalejo), desdén (solterona), menosprecio (alguacilejo), etc., a los que habría y que añadir los aumentativos.
 

ANALIZADOR

El Segundo elemento integrante del sistema MGARCI, en analizadore, provee un analisis  de cada palabra del texto  indicando el lema/s con acceso instantáneo a un análisis morfológico más detallado, a su definición, parte de la oración, traducción a varios idiomas, etimología, etc.  Esta prestación funciona, de momento, con todas las palabras de ortografía moderna.  Próximamente el análisis será aplicable a multitud de palabras del español antiguo, medieval  y Siglo de Oro.

El análisis es accessible desde la listas de palabras de la columna de la izquierda; tras el clic en acometiendoos en la ilustación que sigue (Fig. 5), aparece el resultado a la derecha con indicación del método a seguir para un análisis más completo que incluye el enlace con el Diccionario de la Real Academia.

 

Fig. 7

 

En el futuro, cuando el análisis se extienda al español antiguo, la presentación se hará de manera semejante; por ejemplo, de tratarse de la palabra auiedesles, al lector se le indicará la forma canónica,  el elma/s, parte de la oración, sufijo, con los respectivos enlaces. ( nd the user is provided with the equivalent modern word habíais: 

           auiedesles (instructions…)

FORMAhabíaisles            

LEMA/S:  haber (VER)        SUFFIX:   les

 

TESORIZADOR

El terecer elemento, el tesorizador, es muy; su propósito es el de conducer al usuarios de la palabra a la idea, de la idea a la palabra en un texto determinado.  Por lo general los mejores sistemas de concordancias fa militan la búsqueda de palabras y frases, y algunjos incluso llegan aportar sinónimos y antónimos. El MGARCI va mucho más allá: con cada lema, facilita el hyallazgo de todos aquellos en el texto que pueden guardar cierta relación conceptual dentro de una variedad de Campos semánticos de amplio abarque: por ejemplo, RELIGIÓN-CREENCIAS, MEDICINA, ZOOLOGIA, etc., o dentro de estos Campos, los más restringidos Grupos léxicos: dento de RELIGIÓN-CREENCIAS, altar, monastery, …;     dentro de MEDICINA, cirugía, farmacia, etc.

Elconcordador, pues, ayuda al studio de la lengua, la morfologia, sintaxis y estilo, mientras que el tesorizador nos presenta como un mapa mental y anímico del autor, que nos guía hacia sus ideas, su diosincrasia, sus sentimientos, sus gustos, lo que le hace palpitar. El concordador de MGARCI  nos descubre todas las flexiones lingüísticas a través de los lemas; el tesorizador por su parte  nos hace posible el hallazgo de todas las palabras relacionadas con un concepto.

            Tras el clic  en el botón Tesoro  el usuario verá aparecer a la izquierda una dos opciones:

 

Campos semánticos y Grupos léxicos.  El sistema ofrece 66 campos y 524 grupos.  Al seleccionar en la izquierda el campo ENFERMEDAD; MEDICINA, el muestrario de la derecha indica en la franja de arriba  el título, seguido de los varios grupos representados en el texto bajo consideración, en este caso DQ, y las palabras relacionadas (Fig. 8).

Fig. 8

 

El número de palabras incluidas en algunos grupos pueden ser muy numerosas. El sistema es comprensivo en todas las agrupaciones, ofreciendo todas las palabras que pueden encerrar algún tipo de relación sin tener en consideración un contexto determinado. Al lector no le será difícil seleccionar de entre el montón aquellas palabras pertinentes a un concepto; le sería por otro lado imposible incluir cualquier palabra excluida de los grupos. En caso de duda, como me ha pasado con frecuencia, el sistema facilita la definición de cualquier palabra desconocida con solo escribirla, como lema (precedida de @) en la ventanita de búsqueda.