基于类分解的矢量空间模型在脚本文档搜索引擎中的实现

Ikwan Rizki Priandono, Nanang Fakhrur Rozi, Maftahatul Hakimah
{"title":"基于类分解的矢量空间模型在脚本文档搜索引擎中的实现","authors":"Ikwan Rizki Priandono, Nanang Fakhrur Rozi, Maftahatul Hakimah","doi":"10.30591/JPIT.V5I2.2079","DOIUrl":null,"url":null,"abstract":"Skripsi merupakan salah satu persyaratan untuk kelulusan seorang mahasiswa. Untuk menentukan tema skripsi, mahasiswa dapat mencari referensi dari sumber eksternal dari website seperti Research Gate, Springer, IEEE dan Science Direct. Sedangkan salah satu sumber referensi internal yaitu website perpustakaan ITATS yang menyimpan dokumen skripsi yang sudah diselesaikan oleh Mahasiswa ITATS. Di Jurusan Teknik Informatika ITATS terdapat 3 bidang minat yang dapat dijadikan kelas pada dokumen skripsi yaitu Kecerdasan Buatan, Rekayasa Perangkat Lunak, dan Jaringan Komputer. Dengan adanya 3 bidang minat maka pembobotan kata yang diusulkan adalah TF.IDF.ICF dimana ICF melakukan pembobotan kata yang memperhatikan kelas (bidang minat) pada dokumen. Dengan pembobotan TF.IDF.ICF relevansi dari hasil pencarian lebih baik daripada menggunakan TF.IDF dengan nilai mean average precision masing-masing 72,39% dan 71,12%.Abstract - Thesis is one of the requirements for graduation of a student. To determine the thesis theme, students can look for references from external sources from websites such as Research Gate, Springer, IEEE and Science Direct. Meanwhile, one of the internal reference sources is the ITATS library website which stores thesis documents that have been completed by ITATS students. In the ITATS Informatics Engineering Department there are 3 areas of interest that can be used as classes in the thesis document, namely Artificial Intelligence, Software Engineering, and Computer Networks. With the existence of 3 areas of interest, the proposed word weighting is TF.IDF.ICF where ICF carries out term weighting which paying attention to class (areas of interest) in the document. By weighting TF.IDF.ICF, the relevance of the search results is better than using TF.IDF with the mean average precision values 72.39% and 71.12%","PeriodicalId":53375,"journal":{"name":"Jurnal Informatika Jurnal Pengembangan IT","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2020-05-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":"{\"title\":\"Implementasi Vector Space Model Dengan Pembobotan Berbasis Kelas Pada Mesin Pencari Dokumen Skripsi\",\"authors\":\"Ikwan Rizki Priandono, Nanang Fakhrur Rozi, Maftahatul Hakimah\",\"doi\":\"10.30591/JPIT.V5I2.2079\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Skripsi merupakan salah satu persyaratan untuk kelulusan seorang mahasiswa. Untuk menentukan tema skripsi, mahasiswa dapat mencari referensi dari sumber eksternal dari website seperti Research Gate, Springer, IEEE dan Science Direct. Sedangkan salah satu sumber referensi internal yaitu website perpustakaan ITATS yang menyimpan dokumen skripsi yang sudah diselesaikan oleh Mahasiswa ITATS. Di Jurusan Teknik Informatika ITATS terdapat 3 bidang minat yang dapat dijadikan kelas pada dokumen skripsi yaitu Kecerdasan Buatan, Rekayasa Perangkat Lunak, dan Jaringan Komputer. Dengan adanya 3 bidang minat maka pembobotan kata yang diusulkan adalah TF.IDF.ICF dimana ICF melakukan pembobotan kata yang memperhatikan kelas (bidang minat) pada dokumen. Dengan pembobotan TF.IDF.ICF relevansi dari hasil pencarian lebih baik daripada menggunakan TF.IDF dengan nilai mean average precision masing-masing 72,39% dan 71,12%.Abstract - Thesis is one of the requirements for graduation of a student. To determine the thesis theme, students can look for references from external sources from websites such as Research Gate, Springer, IEEE and Science Direct. Meanwhile, one of the internal reference sources is the ITATS library website which stores thesis documents that have been completed by ITATS students. In the ITATS Informatics Engineering Department there are 3 areas of interest that can be used as classes in the thesis document, namely Artificial Intelligence, Software Engineering, and Computer Networks. With the existence of 3 areas of interest, the proposed word weighting is TF.IDF.ICF where ICF carries out term weighting which paying attention to class (areas of interest) in the document. By weighting TF.IDF.ICF, the relevance of the search results is better than using TF.IDF with the mean average precision values 72.39% and 71.12%\",\"PeriodicalId\":53375,\"journal\":{\"name\":\"Jurnal Informatika Jurnal Pengembangan IT\",\"volume\":null,\"pages\":null},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2020-05-31\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"2\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Informatika Jurnal Pengembangan IT\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.30591/JPIT.V5I2.2079\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Informatika Jurnal Pengembangan IT","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.30591/JPIT.V5I2.2079","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2

摘要

圣经是获得学生认可的条件之一。为了确定脚本主题,学生可以从\网站上搜索外部来源的参考资料,如\ Research Gate、\ Springer、IEEE和\ Science Direct。其中一个内部参考来源是ITATS图书馆网站,该网站存储了ITATS学生完成的脚本文档。在ITATS IT技术流程中,有三个感兴趣的领域可以在脚本文档中进行分类:人工智能、软件设计和计算机网络。对于3个感兴趣的字段,则提议的单词撤销是TF.IDF.ICF,其中ICF执行撤销,以观察文档上的类(感兴趣的域)。删除TF.IDF.ICF后,搜索结果的相关性比使用TF.IDF要好,平均精度分别为72.39%和71.12%。摘要[UNK]-[UNK]是学生毕业的要求之一。为了确定论文主题,学生可以从Research Gate、Springer、IEEE和Science Direct等网站上寻找外部来源的参考资料。同时,其中一个内部参考来源是ITATS图书馆网站,该网站存储了ITATS学生完成的论文文档。在ITATS信息工程系,有3个感兴趣的课程可以用作论文文件中的课程,即人工智能、软件工程和计算机网络。在存在3个感兴趣的领域的情况下,所提出的单词权重是TF.IDF.ICF,其中ICF执行关注文档中的类别(感兴趣的区域)的术语权重。通过加权TF.IDF.ICF,搜索结果的相关性优于使用TF.IDF,平均精度值分别为72.39%和71.12%
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Implementasi Vector Space Model Dengan Pembobotan Berbasis Kelas Pada Mesin Pencari Dokumen Skripsi
Skripsi merupakan salah satu persyaratan untuk kelulusan seorang mahasiswa. Untuk menentukan tema skripsi, mahasiswa dapat mencari referensi dari sumber eksternal dari website seperti Research Gate, Springer, IEEE dan Science Direct. Sedangkan salah satu sumber referensi internal yaitu website perpustakaan ITATS yang menyimpan dokumen skripsi yang sudah diselesaikan oleh Mahasiswa ITATS. Di Jurusan Teknik Informatika ITATS terdapat 3 bidang minat yang dapat dijadikan kelas pada dokumen skripsi yaitu Kecerdasan Buatan, Rekayasa Perangkat Lunak, dan Jaringan Komputer. Dengan adanya 3 bidang minat maka pembobotan kata yang diusulkan adalah TF.IDF.ICF dimana ICF melakukan pembobotan kata yang memperhatikan kelas (bidang minat) pada dokumen. Dengan pembobotan TF.IDF.ICF relevansi dari hasil pencarian lebih baik daripada menggunakan TF.IDF dengan nilai mean average precision masing-masing 72,39% dan 71,12%.Abstract - Thesis is one of the requirements for graduation of a student. To determine the thesis theme, students can look for references from external sources from websites such as Research Gate, Springer, IEEE and Science Direct. Meanwhile, one of the internal reference sources is the ITATS library website which stores thesis documents that have been completed by ITATS students. In the ITATS Informatics Engineering Department there are 3 areas of interest that can be used as classes in the thesis document, namely Artificial Intelligence, Software Engineering, and Computer Networks. With the existence of 3 areas of interest, the proposed word weighting is TF.IDF.ICF where ICF carries out term weighting which paying attention to class (areas of interest) in the document. By weighting TF.IDF.ICF, the relevance of the search results is better than using TF.IDF with the mean average precision values 72.39% and 71.12%
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
审稿时长
24 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信