N07-S04-05 06

El uso de ChatGPT como asistente lexicográfico en la elaboración de definiciones

Compartir en TWITTER/FACEBOOK/LINKEDIN

Deja tu comentario

Participa en esta ponencia enviádole tu pregunta o comentario a los autores

Añadir comentario

Firmantes

profile avatar
Lucía Marco MartínezUniversidad Autónoma de Madrid y Universidad Pontificia Comillas

Enfoque

Durante mucho tiempo, los diccionarios han sido una herramienta de referencia que se han entendido como una fuente fiable de datos gramaticales. Estas obras lexicográficas han evolucionado y ahora es el formato digital el que toma el control del mercado y, de entre los formatos digitales, el teléfono móvil es el dispositivo de consulta más utilizado (Ptasznik, 2022). No obstante, en los últimos años se ha apreciado un gran crecimiento en el uso de la inteligencia artificial (IA). A tal respecto, en diciembre del 2022 el lanzamiento del chatbot ChatGPT (Generative Pretained Transformer,https://chat.openai.com) supuso un hito en el ámbito de las tecnologías del lenguaje y su uso ha avivado el interés entre la IA y elaboración de diccionarios. Algunos autores consideran que los resultados obtenidos por herramientas como ChatGPT superan estadísticamente el resultado de algunos diccionarios (Phoodai y Rikk, 2023) y ciertos investigadores predicen el final de la labor lexicográfica (de Schryver y Joffe, 2023). Asimismo, indican que el chatbot es capaz de llevar a cabo tareas lexicográficas, aunque la calidad de los resultados y su precisión dejen que desear (de Schryver y Joffe, 2023 y Tran et al., 2023). No obstante, Schryver y Joffe (2023), al igual que Rundell (2023) y Jakubíček y Rundell (2023), coinciden en que es necesaria la revisión humana en las labores lexicográficas, a pesar de que las máquinas y la IA sean necesarias para programar y trabajar con los datos lexicográficos. Igualmente, Tarp y Nomdedeu (2024) puntualizan que el lexicógrafo tiene la última palabra, ya que es quien manipula al chatbot y lo convierte en un apoyo fundamental. Por su parte, Nichols (2023) y Barrett (2023, citado en de Schryver, 2023) sostienen que ChatGPT puede mostrar datos erróneos o que no son completamente fiables, por lo que el chatbot requiere mejoras. Además, cabe puntualizar que, como indican de Schryver (2023) y Alonso-Ramos (2023), el conocimiento lexicográfico es una ventaja para los investigadores, ya que son los encargados de analizar las respuestas que proporcionan los chatbots, en este caso ChatGPT, a partir de las preguntas guiadas de los expertos.

En este caso, se toma como referencia el estudio de Lew y Mickiewicz (2024), donde los autores investigan la capacidad que tiene el programa ChatGPT-4, versión 4, para crear definiciones monolingües en inglés similares a las recogidas en el COBUILD. En este contexto, nos centramos en una cuestión de eficacia del programa y nos preguntamos hasta qué punto los resultados de ChatGPT para el español son cualitativamente comparables con la microestructura de los diccionarios pedagógicos en español. Las consultas se formularon para los siguientes lemas: caminarcorrerdirgir(se)mover(se) y salir(se). Se trata de cinco verbos de movimiento frecuentes que describen tanto maneras de movimiento como desplazamientos (Morimoto, 2001 y Cifuentes, 2008).

Preguntas y comentarios al autor/es

    • profile avatar

      Javier Antonio Nisa Avila

      Comentó el 21/11/2024 a las 22:16:10

      Hola, Lucía,

      Muy interesante tu ponencia. Teniendo en cuenta que los sistemas de Large Language Model están basados en patrones matemáticos porque no son capaces de comprender ni lengua ni lenguaje, ¿cómo podría llevar en ese estado actual al fin de la lexicografía?

      Muchas gracias.

      Saludos,

      Javier

      • profile avatar

        Lucía Marco Martínez

        Comentó el 22/11/2024 a las 10:26:33

        Hola, Javier:

        Muchas gracias por tu comentario y tus palabras. La pregunta que me planteas es muy controvertida. En el congreso de lexicografía celebrado en Murcia este año hubo un debate muy interesante sobre “el fin de la lexicografía” y la conclusión a la que se llegó fue que la lexicografía siempre va a estar, pero se modificará/adaptará tanto a las nuevas tecnologías, como a las demandas de los usuarios. Personalmente, creo que la Inteligencia Artificial y los sistemas de Large Language Models han venido para quedarse y tenemos que aprovecharlos y trabajar con ellos, al igual que sucedió con la lingüística de corpus hace décadas.
        No obstante, es cierto que, para un usuario medio, preguntar a ChatGPT sobre un lema es muy útil, ya que proporciona información enciclopédica de forma automática y se asemeja a los datos que se pueden encontrar en los diccionarios. Por lo tanto, depende de los lemas que se quieran conocer y, en caso de los conceptos gramaticales, sobre todo semánticos, es donde se encuentra el problema.

        Espero haber contestado a tu pregunta.
        Muchas gracias de nuevo y un saludo,
        Lucía

    • profile avatar

      Juan Rojas-García

      Comentó el 21/11/2024 a las 02:47:55

      Hola, Lucía:

      Afirmas en tu presentación que ChatGPT no comprende algunos conceptos de la lingüística para proporcionar los resultados correctos que se esperan. Y estoy de acuerdo contigo.

      Me gustaría saber si, mediante una interacción larga con ChatGPT y tu destreza al elaborar los prompts, has mostrado a la herramienta que sus resultados no son del todo correctos al definir los verbos de movimiento que tú has seleccionado.

      ¿Y por qué te hago esa pregunta? Es de esperar que, en una conversación larga con ChatGPT en la que le describimos los errores que comete y le ofrecemos muestras o ejemplos correctos, al final, mejoren los resultados. En este proceso de enseñanza a ChatGPT, el diseño de los prompts apropiados parece un aspecto digno de investigar.

      Un saludo,

      Juan

      • profile avatar

        Lucía Marco Martínez

        Comentó el 22/11/2024 a las 10:15:32

        Hola, Juan:

        Muchas gracias por tu comentario y tus palabras. Exactamente, como indicas en el comentario si se tiene una interacción larga con ChatGPT, se le indican los errores y se le proporcionan ejemplos correctos el programa los intenta corregir. No obstante, los conceptos lingüísticos con los que he trabajado, al ser de tipo semántico (tanto los componentes del movimiento como el concepto de argumento interno), la máquina no es capaz de adquirir dichos conocimientos.
        El problema que me he encontrado es el siguiente: si la interacción es larga y le explico los errores, el resultado lexicográfico se puede acercar al deseado, pero si modifico el lema, al trabajar con verbos de movimiento con características semánticas diversas, hay que volver a empezar todo el proceso.

        Espero haber contestado a tu pregunta.
        Muchas gracias de nuevo y un saludo,
        Lucía

    • profile avatar

      Salud Adelaida Flores Borjabad

      Comentó el 20/11/2024 a las 09:29:11

      Estimada Lucía,

      Muchas gracias por tu presentación. Me parece muy interesante, ya que Chat GPT ha venido para quedarse y creo que deberíamos integrarlo de alguna manera. Teniendo en cuenta esto, quisiera hacer la siguiente pregunta: ¿qué aspectos cualitativos considera más relevantes para determinar la eficacia de este modelo en la enseñanza de verbos de movimiento? Por otro lado, también quisiera preguntar ¿qué limitaciones o retos específicos encontraste al trabajar con los lemas seleccionados?

      Muchas gracias.

      Saludos

      Salud A. Flores Borjabad

      • profile avatar

        Lucía Marco Martínez

        Comentó el 22/11/2024 a las 10:08:02

        Estimada Salud:

        Muchas gracias por tu comentario y tus palabras. Respecto a los verbos de movimiento creo que el primer reto es determinar bien cuáles son los componentes semánticos del movimiento, sobre todo delimitar qué es la Manera y qué es la Trayectoria. Muchos verbos de este tipo lexicalizan diversos componentes, por ejemplos algunos lexicalizan Manera y Trayectoria, mientras que otros lexicalizan solo manera, pero con un SP de Trayectoria se incluye el desplazamiento de la Figura. Por lo tanto, a partir del análisis que he llevado a cabo creo que determinar y delimitar los componentes del movimiento es la limitación del trabajo, ya que ChatGPT suele cometer fallos en este aspecto.

        Por otro lado, a nivel lexicográfico ChatGPT te proporciona información enciclopédica y es muy útil para hacerte una idea de un lema, es decir, al programa le preguntas qué es “caminar” y la definición que proporciona para un usuario medio es la correcta. Ahora, si queremos que el chatbot sea el lexicógrafo y marque algunos datos lingüísticos como los componentes de movimiento o el argumento interno del verbo, el programa suele fallar, porque no tienen los conocimiento semánticos/lingüísticos suficientes.

        Espero haber contestado a tus preguntas.
        Muchas gracias de nuevo y un saludo,
        Lucía


Deja tu comentario

Lo siento, debes estar conectado para publicar un comentario.

Organizan

Colaboran

Configuración de Cookies

Utilizamos cookies para mejorar su experiencia y las funcionalidades de esta web. Ver política de cookies

Revisar