Hacia un TreeBank de dependencias para la LSE

Autor/a: GARCÍA MIGUEL, José M.; CABEZA PEREIRO, María del Carmen
Año: 2019
Editorial: Hesperia: Anuario de filología hispánica, 22(2), 111-143
Tipo de código: Copyright
Soporte: Digital

Temas

Lingüística

Detalles

Todo estudio científico necesita datos objetivos en los que basarse y en el estudio del lenguaje y las lenguas los datos están constituidos primariamente por los usos verbales de los hablantes. En las últimas décadas, la Lingüística de Corpus ha desarrollado procedimientos para compilar, catalogar, anotar y explorar textos orales y escritos que puedan constituir muestras representativas de una lengua o variedad de lengua. Al mismo tiempo, se han desarrollado procedimientos y estándares de anotación de las propiedades lingüísticas de los textos en los diferentes niveles de análisis. Para las lenguas más extendidas, como el inglés o el español, existen corpus que cuentan con miles de millones de palabras, y también muchos corpus y otros recursos con anotación morfosintáctica, sintáctica, semántica, etc. de los textos que los constituyen. Sin embargo, de muchas otras lenguas del mundo en comparación apenas disponemos de datos en los que basar las descripciones. En particular, son muy pocas las lenguas de signos para las que existe algún tipo de corpus y menos aún aquellas para las que los corpus existentes cuentan con algún tipo de anotación gramatical.

Ubicación