|
|
|
|
Emeritus Professor |
|
|
Department of
Romance Studies |
|
|
Duke University |
|
|
|
|
|
|
|
|
EL
PROYECTO |
|
|
Multilingüe Genereador
Automático de Rebusca |
|
|
de Concordancias e Ideas (MGARCI) |
|
|
|
|
|
El sitema MGARCI presenta una
herramienta automática, sofisticada y bastante precisa para la búsqueda,
escrutinio y análisis de textos electrónicos en múltiples lenguas. Todos los textos presentan la misma estructura de
búsqueda con procedimientos muy semejantes. El sistema está integrado por
cuatro componentes principales: |
|
|
CONCORDADOR: facilita la concordancia
de todas las palabras del texto, no solo buscando las formas lingüísticas
sino también los lemas, además de locuciones verbales, adverbiales, nominales
y adjetivales, mostrando su concordancia en textos cortos y en todo el texto. |
|
|
ANALIZADOR: ofrece un análisis
detallado de todas las palabras reconocidas en el DRAE
incluso las compuestas de sufijos, además de su definición, traducción a
varios idiomas, etimología y más. |
|
|
TESORIZADOR: facilita al lector pasar de la
palabra a la idea, de la idea a la palabra, ayudándole a identificar todas la palabras del texto relacionadas son un concepto
determinado. |
|
|
AUTOMATIZACION: permite procesar cualquier texto
electrónico, con todas sus prestaciones, en cuestión de minutos, al simple
clic con el cursor del ratón. |
|
|
DESCRIPTION |
|
|
El sistema MGARCI puede verse en su plena
aplicación en las Obras completas de Miguel de Cervantes, accesible en
la red informática bajo esta dirección: http://mgarci.aas.duke.edu/celestina/CERVANTES-MD/DON-QUIJOTE/index.htm |
|
|
La siguiente
figura presenta la página de entrada; se recomienda al lector que, si puede,
trate de ir efectuando las operaciones de las instrucciones a manera que se
van explicando: |
|
|
|
|
|
|
|
|
Fig. 1 |
|
|
|
|
|
CONCORDADOR |
|
|
Las
concordancias han sido celebradas, y con razón. Como fuente magnífica para el
aprendizaje y la enseñaza de lenguas, nativas y adquiridas. El sistema MGARCI tiene entre sus fines ayudar a maestros y alumnos
interesados en satisfacer su curiosidad por encontrar una palabra o una
frase especial en al texto a la vez que brinda una herramienta para un
estudio y análisis profundos. En su casi totalidad las concordancias suelen
ofrecer una ventanita de búsqueda en la que escribir la palabra o
frase. Este sistema es mucho más visual y generoso; ofrece al usuario una
serie de botones (su explicación aparece al posar el cursor de ratón sobre
cada uno de ellos): |
|
|
|
|
|
|
|
|
Fig. 2 |
|
|
Tras un clic en
cada botón se muestra su contenido completo que el usuario podrá escribir en archivo
para estudio por separado, comparación o cualquier otro fin de interés
personal. El hecho de que el diseño ofrezca tal variedad de elementos
visuales, semejantes para todos los textos, logra que un sistema en sí muy
complejo, llegue comprenderse y manejarse perfectamente tras unos cuantos
intentos. Los botones mostrados en segunda línea (Fig. 2), debajo el
autor y título del libro, tras un clic, muestran su contenido: |
|
|
Palabras: todas las palabras del texto en orden
alfabético, con su frecuencia. |
|
|
Termina en: las mismas palabras por orden alfabético
de su terminación; |
|
|
Lemas: la entrada del
diccionario que mostrará tras el clic todas las formas; |
|
|
Frecuencia: los lemas
por orden de frecuencia; |
|
|
Apreciativos: todas las
palabras con sufijos de diminutivo o aumentativo; |
|
|
Locuciones: frases
hechas, adverbiales, nominales, adjetivales, proverbiales del tipo como
boca de lobo, a sangre fría, etc.; |
|
|
Loc. verbales: las que
contienen en su enunciado un verbo inicial y que mostrarán tras el clic todas
sus formas, del tipo decir entre dientes, hacer incapié, etc.; |
|
|
Inter.: todas las
expresiones interrogativas y exclamativas; |
|
|
N. propios: lista de
nombres propios de personas, ciudades, ríos, etc.; |
|
|
Sin lema: lista de
todas las palabras no representadas en a base de datos, entre ellas
arcaísmos, solecismos, nombres propios, palabras extranjeras; por lo general palbras no recogidas en el DRAE
|
|
|
Tesoro: ofrece todas
las palabras del texto clasificadas en Campos semánticos (de contenido
conceptual muy amplio: Reino animal) y Grupos léxicos (de
contenido más limitado dentro del Campo: Mamíferos, Insectos);
|
|
|
Load a Book (operativo con clave): facilita el
proceso del texto tras un simple clic o si se prefiere, por partes, según se
indica. Una vez procesado el texto, admite las búsquedas de las funciones
explicadas. Este sistema automático procesa un libro de mediano tamaño (como de
500 KB) en unos diez minutos mientras el usuario
puede trabajar en otra cosa. |
|
|
|
|
|
Caja de
búsqueda: en la
ventanita de la línea superior el usuario puede efectuar varios tipos de
búsqueda de su interés particular escribiendo: |
|
|
a)
Palabra o su inicio, que al mismo tiempo sirve para
navegar a lo largo del vocabulario, por ejemplo, p, padre, etc. |
|
|
b)
Grupo
fónico interno escrito precedido y seguido de
guión, -isim-, -nch-,
etc.; |
|
|
c)
Terminación escrita precedida de guión; -mente
-ísimamente servirá para encontrar los
adverbios con esas terminaciones; |
|
|
d)
Lema
se escribirá precedido de @ y servirá para
encontras todas las formas que le pertenecen,
incluidas las formas seguidas de pronombres enclíticos, diminutivos,
aumentativos, adverbios. Las formas aparecerán en la columna de la
izquierda por orden alfabético con el lema en cabeza (Fig. 3). El lema @dar
en Don Quijote, por ejemplo, mostrará más de 130 flexiones
diferentes. Tras el clic en el lema, el usuario podrá apreciar en la columna
de la derecha las concordancias de todas las formas por orden alfabético, y
la posibilidad de la definición del diccionario; tras el clic en las formas
individuales la concordancia se limitará a tal forma. El lema, en
cabeza, va seguido de un enlace con Tesoro, que le permitirá al lector
pasar de la palabra a la idea, con lo que podrá comprobar qué otros lemas en
el texto pertenecen a los mimos Campos semánticos y Grupos léxicos
que le lema de interés; |
|
|
|
|
|
e)
Combinación
de palabras: además de palabras indivuduales,
el usuario podrá buscar varias palabras en proximidad escribiéndolas
unidas por el signo + ; por ejmplo, gracias+regalo
podría como resultado gracias por tan precioso regalo; se
facilita también la búsqueda por lema + palabra e, incluso, lema +
lema, por ejemplo @tener+ganas podría encontrar tengo (tenemos,
tenían …) muchas ganas …; @gustar+@ir podría
producir me gustaría haber ido. Este tipo de búsqueda es sensitivo a
mayúsculas y minúsculas, de manera que Caballero+Figura reproducirá en
Don Quijote la combinación Caballero de la Triste Figura. |
|
|
|
|
|
|
|
|
Fig. 3 |
|
|
|
|
|
La concordancia
de la columna de la derecha va seguida, en todos los tipos de búsqueda, de la
información del autor y título del libro, su localización en el texto ( por ejemplo, Parte, Capítulo) y, de existir, como
en DQ, de enlace con la edición Princeps.
Tras el clic, la imagen de esta edición aparecerá en paralelo con el texto de
la edición moderna, permitiendo así al lector comparar las dos
versiones. La palabra de interés aparecerá iluminada para guiar al lector a
hallarla en la imagen como puede apreciarse en Fig. 4 con la palabra abad: |
|
|
|
|
|
|
|
|
Fig. 4 |
|
|
|
|
|
El sistema MGARCI está capacitado para detectar y mostrar las notas
al texo y la traducción bilingüe, en textos
paralelos, si la edición las lleva (DQ lleva
múltiples notas y traducción a cuatro idiomas). El clic en la localización de
la concordancia genera en la misma columna el contexto más amplio (Fig.4),
con la palabra de interés iluminada, en este caso da.
De haber notas al texto (n sobrescrita) aparecerán
en la columna de la izquierda. Cada párrafo en el texto, como se indica en
Fig. 5, lleva un enlace (T soberscrito)
a su traducción al inglés en DQ. |
|
|
|
|
|
|
|
|
Fig. 5 |
|
|
|
|
|
Desde esa
traducción, con el clic en T, el lector puede enlazar, como viene
indicado en Fig. 6, con las traducciones al alemán (AL),
francés (FR) o italiano (IT); he
aquí un ejemplo de la traducción al inglés: |
|
|
|
|
|
|
|
|
Fig.6 |
|
|
|
|
|
Este
concordador, como se viene explicando, ofrece muchas prestaciones para un
estudio en profundidad del estilo, el arte de la expresión peculiar y
característica de un escritor. |
|
|
Por ejemplo,
ayudará al lector a discernir en un texto determinado |
|
|
a)
Los méritos
estilísticos de la frecuencia o rareza del uso de adjetivos, adverbios, exclamaciones,
frases hechas, expresiones de relleno, etc.; |
|
|
b)
Los efectos emotivos
de exclamaciones, preguntas, etc.; |
|
|
c)
La rotundidad de
expresión del autor en su frecuente uso de nunca, siempre, todo,
nada, nadie, en absoluto, completamente, sin duda, estoy seguro, y
otros, frente a una actitud más recatada que prodra
reflejarse en posiblemente, quizás, creer, ocurrírsele, opinar, etc.; |
|
|
d)
Apreciativos: Mientras que en el francés
y el inglés los sufijos apreciativos son relativamente raros y sirven para
indicar tamaño o importancia en mayor o menor grado de lo normal, son
abundantes y variados en el español, con los que se intensifica el
significado de la palabra base (ahora mismito), o se expresan
emociones de cariño (mamita), o de ternura (hijito), ridiculez
(regalejo), desdén (solterona), menosprecio (alguacilejo),
etc., a los que habría y que añadir los aumentativos. |
|
|
ANALIZADOR |
|
|
El Segundo elemento integrante del sistema MGARCI,
en analizadore, provee un analisis
de cada palabra del texto indicando el lema/s con acceso instantáneo a
un análisis morfológico más detallado, a su definición, parte de la oración,
traducción a varios idiomas, etimología, etc. Esta prestación funciona,
de momento, con todas las palabras de ortografía moderna. Próximamente
el análisis será aplicable a multitud de palabras del español antiguo,
medieval y Siglo de Oro. |
|
|
El análisis es accessible desde la listas de palabras de la columna de
la izquierda; tras el clic en acometiendoos
en la ilustación que sigue (Fig. 5),
aparece el resultado a la derecha con indicación del método a seguir para un
análisis más completo que incluye el enlace con el Diccionario de la Real
Academia. |
|
|
|
|
|
|
|
|
Fig. 7 |
|
|
|
|
|
En el futuro, cuando el
análisis se extienda al español antiguo, la presentación se hará de manera
semejante; por ejemplo, de tratarse de la palabra auiedesles,
al lector se le indicará la forma canónica, el elma/s,
parte de la oración, sufijo, con los respectivos enlaces. ( nd the user is provided with the equivalent modern word habíais: |
|
|
auiedesles (instructions…) |
|
|
|
|
|
|
|
TESORIZADOR |
|
|
El terecer elemento,
el tesorizador, es muy; su propósito es el de conducer al usuarios de la palabra a la idea, de la idea
a la palabra en un texto determinado. Por lo general los mejores
sistemas de concordancias fa militan la búsqueda de palabras y frases, y algunjos incluso llegan aportar sinónimos y antónimos. El
MGARCI va mucho más allá: con cada lema, facilita
el hyallazgo de todos aquellos en el texto que
pueden guardar cierta relación conceptual dentro de una variedad de Campos
semánticos de amplio abarque: por ejemplo, RELIGIÓN-CREENCIAS, MEDICINA, ZOOLOGIA, etc., o dentro de estos Campos, los más
restringidos Grupos léxicos: dento de
RELIGIÓN-CREENCIAS, altar, monastery, …;
dentro de MEDICINA, cirugía, farmacia, etc. |
|
|
Elconcordador, pues, ayuda al studio de la lengua, la morfologia,
sintaxis y estilo, mientras que el tesorizador nos
presenta como un mapa mental y anímico del autor, que nos guía hacia sus
ideas, su diosincrasia, sus sentimientos, sus
gustos, lo que le hace palpitar. El concordador de MGARCI
nos descubre todas las flexiones lingüísticas a través de los lemas; el tesorizador por su parte nos hace posible el
hallazgo de todas las palabras relacionadas con un concepto. |
|
|
Tras el clic en el botón Tesoro el usuario verá aparecer a
la izquierda una dos opciones: |
|
|
|
|
|
Campos semánticos y Grupos
léxicos. El sistema ofrece 66 campos y 524 grupos. Al
seleccionar en la izquierda el campo ENFERMEDAD; MEDICINA, el muestrario de
la derecha indica en la franja de arriba el título, seguido de los
varios grupos representados en el texto bajo consideración, en este caso DQ, y las palabras relacionadas (Fig. 8). |
|
|
|
|
|
Fig. 8 |
|
|
|
|
|
El número de palabras incluidas en algunos
grupos pueden ser muy numerosas. El sistema es comprensivo en todas las
agrupaciones, ofreciendo todas las palabras que pueden encerrar algún tipo de
relación sin tener en consideración un contexto determinado. Al lector no le
será difícil seleccionar de entre el montón aquellas palabras pertinentes a
un concepto; le sería por otro lado imposible incluir cualquier palabra
excluida de los grupos. En caso de duda, como me ha pasado con frecuencia, el
sistema facilita la definición de cualquier palabra desconocida con solo
escribirla, como lema (precedida de @) en la ventanita de búsqueda. |
|
|
|