Enfoque
En las últimas décadas, la lingüística ha experimentado un creciente interés por las posibilidades que ofrece lo digital (Crespo Miguel 2021), manifestado desde dos enfoques principales: por un lado, la exploración y el uso de las herramientas digitales para el estudio lingüístico y, por otro, el interés por conocer las características propias del lenguaje utilizado en contextos digitales (Sánchez Saus-Laserna 2022:255). Este segundo enfoque ha adquirido una relevancia creciente teniendo en cuenta que los entornos digitales no sólo han propiciado el surgimiento de nuevos géneros discursivos, sino que también han favorecido a la creación de nuevas unidades léxicas. De este modo, los medios digitales, especialmente, las redes sociales, se convierten en un terreno fértil para el estudio de la neología.
La detección de neologismos en corpus es uno de los campos de actuación principales de la neología léxica aplicada (Casas Gómez 2020), especialmente de manera sistemática (Cabré et al. 1995, 2004) en los últimos años como resultado de la incorporación de medios y soportes informáticos en el trabajo en investigación lingüística. Generalmente, el vaciado de neologismos suele realizarse a través del compilado y procesamiento de corpus de prensa. Sin embargo, la disponibilidad de textos accesibles desde la web está modificando el concepto de corpus (González Fernández 2017, Rojo 2021) y dotando a las redes sociales de un estatus de fuente útil para la creación de corpus textuales enfocados a investigaciones de base lingüística.
Este trabajo explora las posibilidades que pueden ofrecer técnicas propias del procesamiento del lenguaje natural para la extracción de neologismos, ya que la lingüística computacional adquiere un papel fundamental en la construcción de muestras de uso de la lengua (Esteban Asencio 2008). Esta propuesta consiste en el diseño de un sistema capaz de detectar neologismos formales de la lengua española en Twitter/X a través de una metodología basada en el análisis contrastivo de un corpus de tweets con una lista de exclusión de tipo lexicográfico. Este proceso es semi-automático, pues proponemos una primera aproximación automática y cuantitativa a los datos contenidos en el corpus, seguida de una validación manual de los candidatos a neologismos y la descripción lingüística de los mismos, fruto de la sinergia entre la automatización de tareas y la intuición y conocimiento lingüístico llevado a cabo de manera manual (Cartier 2017).
Nos centraremos en la esfera de interés de la comunidad de streaming hispanohablante con el fin de extraer las unidades neológicas formales que son distintivas y características del léxico de esta comunidad, como consecuencia de la comunicación inmediata que caracteriza a las redes sociales. Para ello, seleccionamos los tweets publicados bajo el hashtag #esland2023 con el fin de delimitar la esfera de interés de la que se extraerán los neologismos potenciales o candidatos a neologismo.
Se plantean los siguientes objetivos:
-
Diseñar un extractor semi-automático de neologismos basado en el contraste con una lista de exclusión a partir de un corpus de Twitter/X, y
-
Extraer los neologismos propios del léxico de la comunidad hispanohablante de streaming y disponerlos en una base de datos con información interna (i.e. datos contenidos en el corpus) y externa (i.e. descripción lingüística de los neologismos).
Lucía Marco Martínez
Comentó el 21/11/2024 a las 17:38:20
Estimada Isabel:
Felicidades por tu comunicación, me ha perecido muy interesante el tratamiento de neologismos y la creación de un corpus a partir de las publicaciones en Twitter-X.
En la ponencia indicas que has utilizado el CREA para elaborar la lista de exclusión lexicográfica, pero me gustaría saber si has usado o usarás el CORPES XXI para contrastar algunos términos. En el CORPES XXI se recoge la tipología textual “mensajes en redes sociales”, por lo que también puedes obtener resultados sobre frecuencia o ejemplos de uso de algunos neologismos (aunque todavía no haya muchos incluidos).
Muchas gracias y un saludo,
Lucía
Isabel Moyano Moreno
Comentó el 21/11/2024 a las 18:47:20
Hola, Lucía:
Muchas gracias por tus palabras y por tu interés :-) Efectivamente, utilicé el CREA para elaborar la lista de exclusión lexicográfica, pero tienes toda la razón al sugerir el CORPES XXI. Su inclusión de la tipología textual “mensajes en redes sociales” lo convierte en un recurso muy valioso para este tipo de estudios, de manera que me planteo utilizarlo para contrastar algunos neologismos y explorar sus frecuencias y ejemplos de uso. Aunque, como mencionas, todavía no hay muchos neologismos incluidos, considero que puede ofrecer un punto de referencia interesante para identificar cómo ciertos términos empiezan a integrarse en el uso general.
Te agradezco mucho la sugerencia y el interés en mi trabajo.
Abrazos,
Isabel
Victoria M. García Garrido
Comentó el 21/11/2024 a las 12:25:24
Gracias por tu ponencia.
Este modo semiautomático de extraer datos para realizar un corpus me ha parecido muy útil y práctico.
Según los resultados hay una tendencia clara a adoptar palabras provenientes del inglés, ¿cuál crees que podría ser la causa de esto?
Por otro lado, viendo la pregunta de la colega Salud A. y tu respuesta a la misma, me pregunto si la metodología utilizada en tu estudio se podría realizar sobre publicaciones de Instagram siguiendo el mismo método de los hashtags (me refiero a las publicaciones con texto). Tengo planteado un estudio similar y planeaba recoger datos manualmente por lo cual el método que has utilizado me resulta muy interesante.
Gracias y un saludo.
Victoria
Isabel Moyano Moreno
Comentó el 21/11/2024 a las 18:40:37
¡Muchas gracias, Victoria, por tu interés y tus preguntas tan interesantes! Me alegra que hayas encontrado tanto el método como el corpus. Respecto a la tendencia de adoptar palabras que proceden del inglés, supongo que se debe principalmente a la influencia cultural y económica del mundo angloparlante a nivel global, sumada a la rapidez con la que las palabras en inglés se difunden a través de las redes. Además, el prestigio que muchas veces se asocia al inglés en diversos contextos supongo que también juega un papel importante en estos casos.
En cuanto a aplicar la metodología a publicaciones de Instagram, lo veo completamente viable. La extracción de hashtags es un excelente punto de partida, ya que permite identificar tendencias lingüísticas y temáticas. De hecho, hay autores, como Mahfouz (2020), que sugieren que los hashtags pueden ser casi un nuevo lenguaje debido a sus características lingüísticas y funciones específicas. Esto, la verdad, es que abre un mundo de posibilidades. Igual te interesa leer en esta línea algunos trabajos sobre la comunicación mediada por ordenador o CMO.
Espero haber contestado a tu pregunta. En cualquier caso, si puedo ayudarte con algo, no dudes en escribirme.
Abrazos,
Isabel
Victoria M. García Garrido
Comentó el 22/11/2024 a las 10:48:11
¡Muchas gracias por la respuesta y por las recomendaciones! Me guardo tu contacto para futuras referencias.
Un abrazo,
Victoria
Noelia Estévez Rionegro
Comentó el 21/11/2024 a las 02:42:51
Enhorabuena por su trabajo. Me ha parecido especialmente útil la metodología: la creación del extractor de neologismos y su conversión en corpus. ¿Han pensado en ponerlo disponible al público? Sería un recurso de gran utilidad para realizar investigaciones empíricas de diversa índole. Muchas gracias por su contribución.
Isabel Moyano Moreno
Comentó el 21/11/2024 a las 12:28:29
Hola, Noelia: Sí que es algo que hemos planteado, pero creo que la librería de scrapeo (snscrape) ya no funciona con el nuevo X. Sería cuestión de ver hasta qué punto X permite la descarga de tweets. Sobre el corpus, aunque pequeño, sí que le veo posibilidades de publicación a corto-largo plazo. Igual en la publicación que deriva de esta comunicación me animo a ponerlo a disposición de otros investigadores, aunque creo que tendría que anonimizar los datos de los usuarios, en este caso. Muchísimas gracias por tu comentario.
Abrazos,
Isabel
Salud Adelaida Flores Borjabad
Comentó el 20/11/2024 a las 09:24:54
Estimada Isabel,
Me ha gustado mucho tu presentación. Me parece muy interesante y digna de tener en cuenta. Es cierto que las redes son un foco de desarrollo lingüístico que muchas veces se ignora o, incluso, se llega a criticar, cuando realmente se producen nuevas palabras que pueden formar parte de la sociedad. En cualquier caso, mi pregunta es más curiosidad que otra cosa. Quisiera saber si tu estudio realizado se puede equiparar a otras redes como Instagram o, incluso, TikTok que es muy usada últimamente por gente joven.
Muchas gracias.
Saludos,
Salud A. Flores Borjabad
Isabel Moyano Moreno
Comentó el 20/11/2024 a las 22:24:43
Querida Salud:
Muchísimas gracias por tu comentario. Me alegro de que la investigación te haya parecido interesante. La verdad es que sí que me había planteado extrapolar esta metodología a otras redes sociales, sobre todo a TikTok, que como comentas, está muy de moda. El problema es que esta red social cuenta con la particularidad de que se basa en vídeos cortos, y que rara vez incluyen texto en la descripción o caption. Entonces, el corpus de vaciado de neologismos cambiaría completamente en su naturaleza, porque tendríamos que construir un corpus multimodal, que integrase vídeo y transcripciones de audio. Desde luego, sería muy interesante, pero todo un desafío a la hora de extraer estos datos de la manera lo más automática posible.
Espero haber contestado a tu pregunta.
Un abrazo,
Isabel
Deja tu comentario
Lo siento, debes estar conectado para publicar un comentario.
Organizan
Colaboran
Configuración de Cookies
Utilizamos cookies para mejorar su experiencia y las funcionalidades de esta web. Ver política de cookies