{"title":"Serverless Named Entity Recognition untuk Teks Instruksional Pertanian Kota","authors":"Trisna Gelar, Aprianti Nanda, Akhmad Bakhrun","doi":"10.28932/jutisi.v8i3.5447","DOIUrl":null,"url":null,"abstract":"Named Entity Recognition(NER) merupakan bagian dari pengembangan perangkuman dokumen, klasifikasi dan pencarian informasi. Implementasi NER pada domain pertanian, khususnya teks instruksional atau transkripsi video tutorial, akan memudahkan masyarakat umum memahami konsep dan istilah khusus dari kegiatan pertanian kota seperti proses dan prosedur produksi tanaman, metode dan alat pertanian, siklus panen, dan penanganan hama atau penyakit tanaman. Spacy merupakan alat bantu NLP, memiliki dua metode pengembangan model NER, yaitu dengan Toc2Vec dan Transformer. Kedua metode memiliki kelebihan dan kekurangan, yaitu ukuran, performansi dan kecepatan prediksi yang berbeda beda sesuai kebutuhan. Model NER dapat diimplementasikan menjadi aplikasi Serverless, dengan menggunakan pendekatan Fungsional as Services (FaaS) dan Backend as Services (BaaS). Pada penelitian ini telah dikembangkan tiga model NER untuk data teks instruksional pertanian sub topik budidaya tanaman buah. Model berbasis Toc2Vec dengan optimasi efisiensi, Model Toc2Vec dengan optimasi akurasi dan Model berbasis IndoBERT. Model berbasis Transformer memiliki nilai f1-score terbaik sebesar 0.71 disusul Model Toc2Vec Efisiensi sebesar 0.60 dan Model Toc2Vec Efektif dan 0.57. Model Toc2Vec tidak dapat memprediksi entitas numerik dengan baik, Prediksi entitas COUNT, PERIOD dan VERIETAS selalu tertukar. Selain itu Ukuran model berbanding lurus dengan kecepatan prediksi kata per detik, dalam hal ini Model Toc2Vec optimasi efisiensi unggul, model tersebut mudah diimplementasikan menjadi Serverless berbasis FaaS dan BaaS. Fungsionalitas dari Serverless ML telah berhasil diuji menggunakan metode Blackbox.","PeriodicalId":185279,"journal":{"name":"Jurnal Teknik Informatika dan Sistem Informasi","volume":"6 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-12-21","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknik Informatika dan Sistem Informasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.28932/jutisi.v8i3.5447","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Named Entity Recognition(NER) merupakan bagian dari pengembangan perangkuman dokumen, klasifikasi dan pencarian informasi. Implementasi NER pada domain pertanian, khususnya teks instruksional atau transkripsi video tutorial, akan memudahkan masyarakat umum memahami konsep dan istilah khusus dari kegiatan pertanian kota seperti proses dan prosedur produksi tanaman, metode dan alat pertanian, siklus panen, dan penanganan hama atau penyakit tanaman. Spacy merupakan alat bantu NLP, memiliki dua metode pengembangan model NER, yaitu dengan Toc2Vec dan Transformer. Kedua metode memiliki kelebihan dan kekurangan, yaitu ukuran, performansi dan kecepatan prediksi yang berbeda beda sesuai kebutuhan. Model NER dapat diimplementasikan menjadi aplikasi Serverless, dengan menggunakan pendekatan Fungsional as Services (FaaS) dan Backend as Services (BaaS). Pada penelitian ini telah dikembangkan tiga model NER untuk data teks instruksional pertanian sub topik budidaya tanaman buah. Model berbasis Toc2Vec dengan optimasi efisiensi, Model Toc2Vec dengan optimasi akurasi dan Model berbasis IndoBERT. Model berbasis Transformer memiliki nilai f1-score terbaik sebesar 0.71 disusul Model Toc2Vec Efisiensi sebesar 0.60 dan Model Toc2Vec Efektif dan 0.57. Model Toc2Vec tidak dapat memprediksi entitas numerik dengan baik, Prediksi entitas COUNT, PERIOD dan VERIETAS selalu tertukar. Selain itu Ukuran model berbanding lurus dengan kecepatan prediksi kata per detik, dalam hal ini Model Toc2Vec optimasi efisiensi unggul, model tersebut mudah diimplementasikan menjadi Serverless berbasis FaaS dan BaaS. Fungsionalitas dari Serverless ML telah berhasil diuji menggunakan metode Blackbox.
Named Entity recogny是文档、分类和信息搜索联合开发的一部分。实现农业域,特别是教学文本或视频教程转录,将有助于公众理解城市农业活动的具体概念和术语,如作物生产过程和过程、农业方法和工具、收获周期和植物害虫或疾病管理。Spacy是NLP的一个辅助工具,它有两种发展模型的方法,分别是Toc2Vec和Transformer。这两种方法都有优点和缺点,即大小、性能和预测速度因需要而不同。NER模型可以应用于服务器应用程序,使用功能性的美国服务方法和BaaS后端。在这项研究中,已经开发了三种作物教学亚主题传播者数据模式。基于Toc2Vec的模型具有效率优化,Toc2Vec模型具有准确性优化和基于IndoBERT模型。基于Transformer的模型成绩最好为0.71分,其次是效率0.60的Toc2Vec模型,有效的Toc2Vec模型和0.57分。Toc2Vec模型无法很好地预测数字实体、计数、周期和真伪的预测实体。除了模型的大小与每秒预测速度的线性比,在这个例子中,Toc2Vec模型的高效率优化,它很容易实现为基于FaaS和BaaS的服务器。ML服务器功能已通过黑盒方法成功测试。