Workshop on Arabic Natural Language Processing最新文献_第2页

AraBERT Model for Propaganda Detection 用于宣传检测的AraBERT模型

Workshop on Arabic Natural Language Processing Pub Date : 1900-01-01 DOI: 10.18653/v1/2022.wanlp-1.61

Mohamad Sharara, Wissam Mohamad, Ralph Tawil, Ralph Chobok, Wolf Assi, Antonio Tannoury

引用次数: 0

Gulf Arabic Diacritization: Guidelines, Initial Dataset, and Results 海湾阿拉伯语变音符化:指南，初始数据集和结果

Workshop on Arabic Natural Language Processing Pub Date : 1900-01-01 DOI: 10.18653/v1/2022.wanlp-1.33

Nouf Alabbasi, Mohamed Al-Badrashiny, Maryam Aldahmani, Ahmed AlDhanhani, Abdullah Saleh Alhashmi, Fawaghy Ahmed Alhashmi, Khalid Al Hashemi, Rama Emad Alkhobbi, Shamma T Al Maazmi, Mohammed Ali Alyafeai, Mariam M Alzaabi, Mohamed Saqer Alzaabi, Fatma Khalid Badri, Kareem Darwish, Ehab Mansour Diab, Muhammad Morsy Elmallah, Amira Ayman Elnashar, Ashraf Elneima, MHD Tameem Kabbani, Nour Rabih, Ahmad Saad, Ammar Mamoun Sousou

引用次数: 1

AraBEM at WANLP 2022 Shared Task: Propaganda Detection in Arabic Tweets 共享任务:阿拉伯语推文中的宣传检测

Workshop on Arabic Natural Language Processing Pub Date : 1900-01-01 DOI: 10.18653/v1/2022.wanlp-1.62

Eshrag A. Refaee, Basem H. A. Ahmed, Motaz K. Saad

引用次数: 2

Identifying Code-switching in Arabizi 识别阿拉伯语的语码转换

Workshop on Arabic Natural Language Processing Pub Date : 1900-01-01 DOI: 10.18653/v1/2022.wanlp-1.18

Safaa Shehadi, S. Wintner

引用次数: 2

ChavanKane at WANLP 2022 Shared Task: Large Language Models for Multi-label Propaganda Detection 共享任务:多标签宣传检测的大语言模型

Workshop on Arabic Natural Language Processing Pub Date : 1900-01-01 DOI: 10.18653/v1/2022.wanlp-1.60

Tanmay Chavan, Aditya Kane

引用次数: 2

NLP DI at NADI Shared Task Subtask-1: Sub-word Level Convolutional Neural Models and Pre-trained Binary Classifiers for Dialect Identification NLP DI在NADI共享任务子任务-1:子词级卷积神经模型和预训练的二元分类器用于方言识别

Workshop on Arabic Natural Language Processing Pub Date : 1900-01-01 DOI: 10.18653/v1/2022.wanlp-1.51

Vani Kanjirangat, T. Samardžić, L. Dolamic, Fabio Rinaldi

{"title":"NLP DI at NADI Shared Task Subtask-1: Sub-word Level Convolutional Neural Models and Pre-trained Binary Classifiers for Dialect Identification","authors":"Vani Kanjirangat, T. Samardžić, L. Dolamic, Fabio Rinaldi","doi":"10.18653/v1/2022.wanlp-1.51","DOIUrl":"https://doi.org/10.18653/v1/2022.wanlp-1.51","url":null,"abstract":"In this paper, we describe our systems submitted to the NADI Subtask 1: country-wise dialect classifications. We designed two types of solutions. The first type is convolutional neural network CNN) classifiers trained on subword segments of optimized lengths. The second type is fine-tuned classifiers with BERT-based language specific pre-trained models. To deal with the missing dialects in one of the test sets, we experimented with binary classifiers, analyzing the predicted probability distribution patterns and comparing them with the development set patterns. The better performing approach on the development set was fine-tuning language specific pre-trained model (best F-score 26.59%). On the test set, on the other hand, we obtained the best performance with the CNN model trained on subword tokens obtained with a Unigram model (the best F-score 26.12%). Re-training models on samples of training data simulating missing dialects gave the maximum performance on the test set version with a number of dialects lesser than the training set (F-score 16.44%)","PeriodicalId":355149,"journal":{"name":"Workshop on Arabic Natural Language Processing","volume":"27 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127529534","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 1

Towards Learning Arabic Morphophonology 学习阿拉伯语音素

Workshop on Arabic Natural Language Processing Pub Date : 1900-01-01 DOI: 10.18653/v1/2022.wanlp-1.27

Salam Khalifa, Jordan Kodner, Owen Rambow

引用次数: 2

CNLP-NITS-PP at WANLP 2022 Shared Task: Propaganda Detection in Arabic using Data Augmentation and AraBERT Pre-trained Model WANLP 2022共享任务:使用数据增强和AraBERT预训练模型的阿拉伯语宣传检测

Workshop on Arabic Natural Language Processing Pub Date : 1900-01-01 DOI: 10.18653/v1/2022.wanlp-1.65

Sahinur Rahman Laskar, Rahul Singh, Abdullah Faiz Ur Rahman Khilji, Riyanka Manna, Partha Pakray, Sivaji Bandyopadhyay

引用次数: 3

Dialect & Sentiment Identification in Nuanced Arabic Tweets Using an Ensemble of Prompt-based, Fine-tuned, and Multitask BERT-Based Models 使用基于提示，微调和多任务基于bert的模型集合的微妙阿拉伯语推文方言和情感识别

Workshop on Arabic Natural Language Processing Pub Date : 1900-01-01 DOI: 10.18653/v1/2022.wanlp-1.48

Reem Abdel-Salam

引用次数: 6

Arabic dialect identification using machine learning and transformer-based models: Submission to the NADI 2022 Shared Task 使用机器学习和基于转换器的模型识别阿拉伯语方言:提交给NADI 2022共享任务

Workshop on Arabic Natural Language Processing Pub Date : 1900-01-01 DOI: 10.18653/v1/2022.wanlp-1.50

Nouf AlShenaifi, Aqil M. Azmi

引用次数: 3