Procesamiento del Lenguaje Natural最新文献

Extraction of Terms Semantically Related to Colponyms: Evaluation in a Small Specialized Corpus 语料库相关词的语义提取:小型专业语料库中的评价

IF 0.8

Procesamiento del Lenguaje Natural Pub Date : 2021-09-06 DOI: 10.26342/2021-67-12

Juan Rojas Garcia

引用次数: 0

Using Dependency-Based Contextualization for transferring Passive Constructions from English to Spanish 基于依存的语境化在英语被动句向西班牙语转换中的应用

IF 0.8

Procesamiento del Lenguaje Natural Pub Date : 2021-03-02 DOI: 10.26342/2021-66-4

Pablo Gamallo, Gorka Labaka Intxauspe

引用次数: 0

Identification and translation of verb+noun Multiword Expressions: A Spanish-Basque study 动词+名词多词短语的识别与翻译:西班牙语-巴斯克语研究

IF 0.8

Procesamiento del Lenguaje Natural Pub Date : 2020-03-27 DOI: 10.26342/2020-64-15

U. Inurrieta

引用次数: 0

Automatic proficiency classification in L2 Portuguese L2葡萄牙语自动熟练程度分类

IF 0.8

Procesamiento del Lenguaje Natural Pub Date : 2019-09-01 DOI: 10.26342/2019-63-7

R. Gayo, Iria del

引用次数: 1

A Supervised Central Unit Detector for Spanish 西班牙语监督中央单元检测器

IF 0.8

Procesamiento del Lenguaje Natural Pub Date : 2018-03-01 DOI: 10.26342/2018-60-3

Kepa Xabier Bengoetxea Kortazar, Mikel Quintian

引用次数: 1

Detección de Patrones Psicolingüísticos para el Análisis de Lenguaje Subjetivo en Español 西班牙语主观语言分析的心理语言模式检测

IF 0.8

Procesamiento del Lenguaje Natural Pub Date : 2018-03-01 DOI: 10.26342/2018-60-10

María del Pilar Salas-Zárate

{"title":"Detección de Patrones Psicolingüísticos para el Análisis de Lenguaje Subjetivo en Español","authors":"María del Pilar Salas-Zárate","doi":"10.26342/2018-60-10","DOIUrl":"https://doi.org/10.26342/2018-60-10","url":null,"abstract":"OBJETIVOS. La clasificacion automatica de opiniones requiere un esfuerzo multidisciplinario, donde la linguistica y el procesamiento del lenguaje natural juegan un rol importante. Un aspecto importante a considerar en la clasificacion de opiniones es el lenguaje figurado tal como la ironia, el sarcasmo y la satira, ya que el doble sentido expresado en una opinion o comentario puede invertir la polaridad de la opinion. El objetivo principal de esta tesis es la deteccion de patrones psicolinguisticos para el analisis de lenguaje subjetivo en espanol. Especificamente, se establecieron 4 objetivos especificos: 1) diseno de un metodo para la deteccion de patrones psicolinguisticos para el analisis de sentimientos; 2) diseno de un metodo para la deteccion de patrones psicolinguisticos para el analisis de textos satiricos y no satiricos; 3) validacion del metodo para el analisis de sentimientos en diversos dominios como el turistico y peliculas; 4) validacion del metodo para la deteccion automatica de la satira en el dominio de noticias. METODOLOGIA. Para lograr este objetivo, primero se lleva a cabo un estudio del estado del arte que incluye tecnologias de procesamiento de lenguaje natural, analisis de sentimientos y lenguaje subjetivo. Especificamente, los diferentes niveles de procesamiento, principales enfoques del analisis de sentimientos, niveles de procesamiento de la opinion, bases de conocimiento, recursos linguisticos disponibles y principales tecnicas para la deteccion del lenguaje figurado. Posteriormente, se realiza el diseno e implementacion de un metodo para el analisis de sentimientos y deteccion de la satira basados en caracteristicas psicolinguisticas. Finalmente, la propuesta se valida en diferentes dominios. Concretamente, el metodo de analisis de sentimientos se aplica al dominio turistico y de peliculas; y el metodo de deteccion de la satira se aplica en el dominio de noticias en redes sociales. RESULTADOS. Como resultado se obtiene: o Un metodo para la clasificacion de sentimientos y deteccion de la satira. Este metodo permite clasificar opiniones como positivas, negativas, neutras, muy positivas y muy negativas y tweets como satiricos y no satiricos. o Un proceso para el pre-procesamiento de tweets en espanol. o Un corpus en el dominio del turismo. El corpus contiene 1600 opiniones sobre hoteles, restaurantes, museos, entre otros temas, las cuales son clasificadas con su respectiva polaridad (positivo, negativo, neutro, muy positivo, muy negativo). o Un corpus de tweets satiricos y no satiricos. Este corpus consiste en un conjunto de 10000 tweets etiquetados como satiricos y no satiricos extraidos desde diversas cuentas de Twitter. o Un conjunto de caracteristicas psicolinguisticas para la clasificacion de sentimientos y deteccion de la satira. CONCLUSIONES. La clasificacion automatica de opiniones requiere un esfuerzo donde la linguistica y el procesamiento del lenguaje natural juegan un rol importante. Gracias a estas disciplin","PeriodicalId":43929,"journal":{"name":"Procesamiento del Lenguaje Natural","volume":"142 1","pages":"79-82"},"PeriodicalIF":0.8,"publicationDate":"2018-03-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"75544056","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 1

On the Mono- and Cross-Language Detection of Text Re-Use and Plagiarism 关于文本重复使用和剽窃的单语言和跨语言检测

IF 0.8

Procesamiento del Lenguaje Natural Pub Date : 2013-04-15 DOI: 10.4995/THESIS/10251/16012

Alberto Barrón Cedeño

引用次数: 34

Linguistic-based Patterns for Figurative Language Processing: The Case of Humor Recognition and Irony Detection 基于语言的比喻语言处理模式:以幽默识别和反语检测为例

IF 0.8

Procesamiento del Lenguaje Natural Pub Date : 2012-07-19 DOI: 10.4995/THESIS/10251/16692

A. Pérez

引用次数: 10

Categorización semi-supervisada de Documentos usando la Web como corpus 使用Web作为语料库对文档进行半监督分类

IF 0.8

Procesamiento del Lenguaje Natural Pub Date : 2011-05-06 DOI: 10.4995/THESIS/10251/6562

R. Cabrera

{"title":"Categorización semi-supervisada de Documentos usando la Web como corpus","authors":"R. Cabrera","doi":"10.4995/THESIS/10251/6562","DOIUrl":"https://doi.org/10.4995/THESIS/10251/6562","url":null,"abstract":"Tesis doctoral en reconocimiento de formas e inteligencia artificial realizada en la Universidad Politecnica de Valencia por Rafael Guzman Cabrera bajo la direccion de los doctores Paolo Rosso y Manuel Montes y Gomez (INAOE, Mexico). La defensa de la tesis tuvo lugar el 24 de noviembre ante el tribunal formado por los doctores Manuel Palomar Sanz (Universidad de Alicante), Paloma Martinez Fernandez (Universidad Carlos III de Madrid), Luis Villasenor Pineda (INAOE, Mexico), Grigori Sidorov (Instituto Politecnico Nacional, Mexico) y Antonio Molina Marco (Universidad Politecnica de Valencia). La calificacion obtenida fue Sobresaliente Cum Laude por unanimidad.\u0000\u0000La mayoria de los metodos para la categorizacion automatica de documentos estan basados en tecnicas de aprendizaje supervisado y, por consecuencia, tienen el problema de requerir un gran numero de instancias de entrenamiento. Con la finalidad de afrontar este problema, en esta tesis se propone un nuevo metodo semi-supervisado para la categorizacion de documentos, el cual considera la extraccion automatica de ejemplos no etiquetados de la Web y su incorporacion al conjunto de entrenamiento. los resultados obtenidos permiten ver la efectividad del metodo desarrollado.","PeriodicalId":43929,"journal":{"name":"Procesamiento del Lenguaje Natural","volume":"99 1","pages":"127-128"},"PeriodicalIF":0.8,"publicationDate":"2011-05-06","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"72531447","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

On Clustering and Evaluation of Narrow Domain Short-Test Corpora 窄域短测试语料库的聚类与评价

IF 0.8

Procesamiento del Lenguaje Natural Pub Date : 2009-03-01 DOI: 10.4995/THESIS/10251/2641

Pinto Avendaño, David Eduardo

{"title":"On Clustering and Evaluation of Narrow Domain Short-Test Corpora","authors":"Pinto Avendaño, David Eduardo","doi":"10.4995/THESIS/10251/2641","DOIUrl":"https://doi.org/10.4995/THESIS/10251/2641","url":null,"abstract":"En este trabajo de tesis doctoral se investiga el problema del agrupamiento de conjuntos especiales de documentos llamados textos cortos de dominios restringidos.\u0000Para llevar a cabo esta tarea, se han analizados diversos corpora y metodos de agrupamiento. Mas aun, se han introducido algunas medidas de evaluacion de corpus, tecnicas de seleccion de terminos y medidas para la validez de agrupamiento con la finalidad de estudiar los siguientes problemas:\u0000-Determinar la relativa dificultad de un corpus para ser agrupado y estudiar algunas de sus caracteristicas como longitud de los textos, amplitud del dominio, estilometria, desequilibrio de clases y estructura.\u0000-Contribuir en el estado del arte sobre el agrupamiento de corpora compuesto de textos cortos de dominios restringidos\u0000El trabajo de investigacion que se ha llevado a cabo se encuentra parcialmente enfocado en el \"agrupamiento de textos cortos\". Este tema se considera relevante dado el modo actual y futuro en que las personas tienden a usar un \"lenguaje reducido\" constituidos por textos cortos (por ejemplo, blogs, snippets, noticias y generacion de mensajes de textos como el correo electronico y el chat).\u0000Adicionalmente, se estudia la amplitud del dominio de corpora. En este sentido, un corpus puede ser considerado como restringido o amplio si el grado de traslape de vocabulario es alto o bajo, respectivamente. En la tarea de categorizacion, es bastante complejo lidiar con corpora de dominio restringido tales como articulos cientificos, reportes tecnicos, patentes, etc.\u0000El objetivo principal de este trabajo consiste en estudiar las posibles estrategias para tratar con los siguientes dos problemas:\u0000a) las bajas frecuencias de los terminos del vocabulario en textos cortos, y\u0000b) el alto traslape de vocabulario asociado a dominios restringidos.\u0000Si bien, cada uno de los problemas anteriores es un reto suficientemente alto, cuando se trata con textos cortos de dominios restringidos, la complejidad del problema se incr","PeriodicalId":43929,"journal":{"name":"Procesamiento del Lenguaje Natural","volume":"os-1 1","pages":""},"PeriodicalIF":0.8,"publicationDate":"2009-03-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"87681148","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 28