Serverless Named Entity Recognition untuk Teks Instruksional Pertanian Kota

Trisna Gelar, Aprianti Nanda, Akhmad Bakhrun
{"title":"Serverless Named Entity Recognition untuk Teks Instruksional Pertanian Kota","authors":"Trisna Gelar, Aprianti Nanda, Akhmad Bakhrun","doi":"10.28932/jutisi.v8i3.5447","DOIUrl":null,"url":null,"abstract":"Named Entity Recognition(NER) merupakan bagian dari pengembangan perangkuman dokumen, klasifikasi dan pencarian informasi. Implementasi NER pada domain pertanian, khususnya teks instruksional atau transkripsi video tutorial, akan memudahkan masyarakat umum memahami konsep dan istilah khusus dari kegiatan pertanian kota seperti proses dan prosedur produksi tanaman, metode dan alat pertanian, siklus panen, dan penanganan hama atau penyakit tanaman. Spacy merupakan alat bantu NLP, memiliki dua metode pengembangan model NER, yaitu dengan Toc2Vec dan Transformer. Kedua metode memiliki kelebihan dan kekurangan, yaitu ukuran, performansi dan kecepatan prediksi yang berbeda beda sesuai kebutuhan. Model NER dapat diimplementasikan menjadi aplikasi Serverless, dengan menggunakan pendekatan Fungsional as Services (FaaS) dan Backend as Services (BaaS). Pada penelitian ini telah dikembangkan tiga model NER untuk data teks instruksional pertanian sub topik budidaya tanaman buah. Model berbasis Toc2Vec dengan optimasi efisiensi, Model Toc2Vec dengan optimasi akurasi dan Model berbasis IndoBERT. Model berbasis Transformer memiliki nilai f1-score terbaik sebesar 0.71 disusul Model Toc2Vec Efisiensi sebesar 0.60 dan Model Toc2Vec Efektif dan 0.57. Model Toc2Vec tidak dapat memprediksi entitas numerik dengan baik, Prediksi entitas COUNT, PERIOD dan VERIETAS selalu tertukar. Selain itu Ukuran model berbanding lurus dengan kecepatan prediksi kata per detik, dalam hal ini Model Toc2Vec optimasi efisiensi unggul, model tersebut mudah diimplementasikan menjadi Serverless berbasis FaaS dan BaaS. Fungsionalitas dari Serverless ML telah berhasil diuji menggunakan metode Blackbox.","PeriodicalId":185279,"journal":{"name":"Jurnal Teknik Informatika dan Sistem Informasi","volume":"6 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-12-21","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknik Informatika dan Sistem Informasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.28932/jutisi.v8i3.5447","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Named Entity Recognition(NER) merupakan bagian dari pengembangan perangkuman dokumen, klasifikasi dan pencarian informasi. Implementasi NER pada domain pertanian, khususnya teks instruksional atau transkripsi video tutorial, akan memudahkan masyarakat umum memahami konsep dan istilah khusus dari kegiatan pertanian kota seperti proses dan prosedur produksi tanaman, metode dan alat pertanian, siklus panen, dan penanganan hama atau penyakit tanaman. Spacy merupakan alat bantu NLP, memiliki dua metode pengembangan model NER, yaitu dengan Toc2Vec dan Transformer. Kedua metode memiliki kelebihan dan kekurangan, yaitu ukuran, performansi dan kecepatan prediksi yang berbeda beda sesuai kebutuhan. Model NER dapat diimplementasikan menjadi aplikasi Serverless, dengan menggunakan pendekatan Fungsional as Services (FaaS) dan Backend as Services (BaaS). Pada penelitian ini telah dikembangkan tiga model NER untuk data teks instruksional pertanian sub topik budidaya tanaman buah. Model berbasis Toc2Vec dengan optimasi efisiensi, Model Toc2Vec dengan optimasi akurasi dan Model berbasis IndoBERT. Model berbasis Transformer memiliki nilai f1-score terbaik sebesar 0.71 disusul Model Toc2Vec Efisiensi sebesar 0.60 dan Model Toc2Vec Efektif dan 0.57. Model Toc2Vec tidak dapat memprediksi entitas numerik dengan baik, Prediksi entitas COUNT, PERIOD dan VERIETAS selalu tertukar. Selain itu Ukuran model berbanding lurus dengan kecepatan prediksi kata per detik, dalam hal ini Model Toc2Vec optimasi efisiensi unggul, model tersebut mudah diimplementasikan menjadi Serverless berbasis FaaS dan BaaS. Fungsionalitas dari Serverless ML telah berhasil diuji menggunakan metode Blackbox.
城市农业教学文本的无服务器命名实体识别
Named Entity recogny是文档、分类和信息搜索联合开发的一部分。实现农业域,特别是教学文本或视频教程转录,将有助于公众理解城市农业活动的具体概念和术语,如作物生产过程和过程、农业方法和工具、收获周期和植物害虫或疾病管理。Spacy是NLP的一个辅助工具,它有两种发展模型的方法,分别是Toc2Vec和Transformer。这两种方法都有优点和缺点,即大小、性能和预测速度因需要而不同。NER模型可以应用于服务器应用程序,使用功能性的美国服务方法和BaaS后端。在这项研究中,已经开发了三种作物教学亚主题传播者数据模式。基于Toc2Vec的模型具有效率优化,Toc2Vec模型具有准确性优化和基于IndoBERT模型。基于Transformer的模型成绩最好为0.71分,其次是效率0.60的Toc2Vec模型,有效的Toc2Vec模型和0.57分。Toc2Vec模型无法很好地预测数字实体、计数、周期和真伪的预测实体。除了模型的大小与每秒预测速度的线性比,在这个例子中,Toc2Vec模型的高效率优化,它很容易实现为基于FaaS和BaaS的服务器。ML服务器功能已通过黑盒方法成功测试。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信