Ryan Ananda Nolly, Amanda Fitria, Kana Saputra S
{"title":"Penerapan Algoritma K-Nearest Neighbors untuk Klasifikasi Fragmen Metagenom Berdasarkan Ekstraksi Fitur K-Mers","authors":"Ryan Ananda Nolly, Amanda Fitria, Kana Saputra S","doi":"10.30872/jim.v17i1.5779","DOIUrl":null,"url":null,"abstract":"Penelitian di bidang metagenomika menjadi salah satu bidang kajian bioinformatika yang terus berkembang. Metagenom merupakan sebuah teknik yang bertujuan untuk mengumpulkan gen-gen yang diambil secara langsung dari lingkungan dan mengenalisis informasi genetika di dalamnya. Data yang diambil langsung dari lingkungan memungkinkan fragmen yang dihasilkan mengandung berbagai mikroorganisme, sehingga akan berakibat pada terjadinya kesalahan perakitan terhadap fragmen metagenom. Proses binning (pengelompokan) dapat dilakukan dengan dua pendekatan, yaitu pendekatan homologi dan pendekatan komposisi. Pendekatan secara komposisi tidak perlu membandingkan dan menyimpulkan setiap hasil pencarian pada setiap level taksonomi sehingga waktu yang diperlukan untuk pengelompokan lebih cepat dibandingkan dengan pendekatan secara homologi.Pada proses binning (pengelompokan) dengan pendekatan komposisi, teknik yang dilakukan adalah dengan supervised learning. Tujuan dari penelitian ini adalah untuk mengklasifikasi fragmen metagenom menggunakan algoritma KNN dan K-Mers sebagai ekstraksi fitur. Selain itu, untuk menghitung tingkat akurasi klasifikasi fragmen metagenom menggunakan confusion matrix. Metode K-Mers yang digunakan sebagai ekstraksi fitur bertujuan untuk mempartisi data dan membentuk satu atau lebih kelompok yang memiliki kesamaan, sehingga perhitungan untuk mencari tingkat akurasi menjadi lebih mudah didapatkan. Berdasarkan hasil pengujian yang dilakukan menunjukkan bahwa semakin rendah nilai K yang digunakanpada KNN maka semakin tinggi akurasi yang diperoleh. Pada pengujian ini diperoleh perhitungan akurasi sebesar 94,37% dimana nilai K untuk KNN adalah 3 dan nilai K untuk K-Mers adalah 3. Hasil klasifikasi fragmen metagenom menggunakan algoritma KNN berdasarkan ekstraksi fitur K-Mers dapat dilakukan dengan baik.","PeriodicalId":149284,"journal":{"name":"Informatika Mulawarman : Jurnal Ilmiah Ilmu Komputer","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2023-07-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Informatika Mulawarman : Jurnal Ilmiah Ilmu Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.30872/jim.v17i1.5779","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

元基因组学的研究成为生物信息学不断发展的领域之一。元基因组是一种收集直接从环境中提取的基因并分析其遗传信息的技术。直接从环境中提取的数据允许生成的碎片含有多种微生物,从而导致对元基因组碎片的组装出错。捆绑方法可以通过两种方法来完成,即同质方法和合成方法。合成方法不需要比较和在每个分类学水平上对每个搜索结果进行总结,这样分组所需要的时间就比同源方法快得多。在合成方法的集合过程中,所做的工程是通过超活化学习。这项研究的目的是利用KNN和K-Mers的算法对元基因组碎片进行分类。此外,用混乱矩阵来计算元基因组碎片分类的准确性水平。K-Mers的提取方法旨在划分数据并形成一个或多个具有相似之处的群体,从而使计算更容易获得准确率。根据所做的测试结果,KNN的K值越低,准确率就越高。在此测试中,KNN的K值是3,K- mers的K值是3。使用KNN提取K-Mers特征的算法对元基因组碎片进行分类的结果是可以很好地做到的。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Penerapan Algoritma K-Nearest Neighbors untuk Klasifikasi Fragmen Metagenom Berdasarkan Ekstraksi Fitur K-Mers
Penelitian di bidang metagenomika menjadi salah satu bidang kajian bioinformatika yang terus berkembang. Metagenom merupakan sebuah teknik yang bertujuan untuk mengumpulkan gen-gen yang diambil secara langsung dari lingkungan dan mengenalisis informasi genetika di dalamnya. Data yang diambil langsung dari lingkungan memungkinkan fragmen yang dihasilkan mengandung berbagai mikroorganisme, sehingga akan berakibat pada terjadinya kesalahan perakitan terhadap fragmen metagenom. Proses binning (pengelompokan) dapat dilakukan dengan dua pendekatan, yaitu pendekatan homologi dan pendekatan komposisi. Pendekatan secara komposisi tidak perlu membandingkan dan menyimpulkan setiap hasil pencarian pada setiap level taksonomi sehingga waktu yang diperlukan untuk pengelompokan lebih cepat dibandingkan dengan pendekatan secara homologi.Pada proses binning (pengelompokan) dengan pendekatan komposisi, teknik yang dilakukan adalah dengan supervised learning. Tujuan dari penelitian ini adalah untuk mengklasifikasi fragmen metagenom menggunakan algoritma KNN dan K-Mers sebagai ekstraksi fitur. Selain itu, untuk menghitung tingkat akurasi klasifikasi fragmen metagenom menggunakan confusion matrix. Metode K-Mers yang digunakan sebagai ekstraksi fitur bertujuan untuk mempartisi data dan membentuk satu atau lebih kelompok yang memiliki kesamaan, sehingga perhitungan untuk mencari tingkat akurasi menjadi lebih mudah didapatkan. Berdasarkan hasil pengujian yang dilakukan menunjukkan bahwa semakin rendah nilai K yang digunakanpada KNN maka semakin tinggi akurasi yang diperoleh. Pada pengujian ini diperoleh perhitungan akurasi sebesar 94,37% dimana nilai K untuk KNN adalah 3 dan nilai K untuk K-Mers adalah 3. Hasil klasifikasi fragmen metagenom menggunakan algoritma KNN berdasarkan ekstraksi fitur K-Mers dapat dilakukan dengan baik.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信