{"title":"基于类分解的矢量空间模型在脚本文档搜索引擎中的实现","authors":"Ikwan Rizki Priandono, Nanang Fakhrur Rozi, Maftahatul Hakimah","doi":"10.30591/JPIT.V5I2.2079","DOIUrl":null,"url":null,"abstract":"Skripsi merupakan salah satu persyaratan untuk kelulusan seorang mahasiswa. Untuk menentukan tema skripsi, mahasiswa dapat mencari referensi dari sumber eksternal dari website seperti Research Gate, Springer, IEEE dan Science Direct. Sedangkan salah satu sumber referensi internal yaitu website perpustakaan ITATS yang menyimpan dokumen skripsi yang sudah diselesaikan oleh Mahasiswa ITATS. Di Jurusan Teknik Informatika ITATS terdapat 3 bidang minat yang dapat dijadikan kelas pada dokumen skripsi yaitu Kecerdasan Buatan, Rekayasa Perangkat Lunak, dan Jaringan Komputer. Dengan adanya 3 bidang minat maka pembobotan kata yang diusulkan adalah TF.IDF.ICF dimana ICF melakukan pembobotan kata yang memperhatikan kelas (bidang minat) pada dokumen. Dengan pembobotan TF.IDF.ICF relevansi dari hasil pencarian lebih baik daripada menggunakan TF.IDF dengan nilai mean average precision masing-masing 72,39% dan 71,12%.Abstract - Thesis is one of the requirements for graduation of a student. To determine the thesis theme, students can look for references from external sources from websites such as Research Gate, Springer, IEEE and Science Direct. Meanwhile, one of the internal reference sources is the ITATS library website which stores thesis documents that have been completed by ITATS students. In the ITATS Informatics Engineering Department there are 3 areas of interest that can be used as classes in the thesis document, namely Artificial Intelligence, Software Engineering, and Computer Networks. With the existence of 3 areas of interest, the proposed word weighting is TF.IDF.ICF where ICF carries out term weighting which paying attention to class (areas of interest) in the document. By weighting TF.IDF.ICF, the relevance of the search results is better than using TF.IDF with the mean average precision values 72.39% and 71.12%","PeriodicalId":53375,"journal":{"name":"Jurnal Informatika Jurnal Pengembangan IT","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2020-05-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":"{\"title\":\"Implementasi Vector Space Model Dengan Pembobotan Berbasis Kelas Pada Mesin Pencari Dokumen Skripsi\",\"authors\":\"Ikwan Rizki Priandono, Nanang Fakhrur Rozi, Maftahatul Hakimah\",\"doi\":\"10.30591/JPIT.V5I2.2079\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Skripsi merupakan salah satu persyaratan untuk kelulusan seorang mahasiswa. Untuk menentukan tema skripsi, mahasiswa dapat mencari referensi dari sumber eksternal dari website seperti Research Gate, Springer, IEEE dan Science Direct. Sedangkan salah satu sumber referensi internal yaitu website perpustakaan ITATS yang menyimpan dokumen skripsi yang sudah diselesaikan oleh Mahasiswa ITATS. Di Jurusan Teknik Informatika ITATS terdapat 3 bidang minat yang dapat dijadikan kelas pada dokumen skripsi yaitu Kecerdasan Buatan, Rekayasa Perangkat Lunak, dan Jaringan Komputer. Dengan adanya 3 bidang minat maka pembobotan kata yang diusulkan adalah TF.IDF.ICF dimana ICF melakukan pembobotan kata yang memperhatikan kelas (bidang minat) pada dokumen. Dengan pembobotan TF.IDF.ICF relevansi dari hasil pencarian lebih baik daripada menggunakan TF.IDF dengan nilai mean average precision masing-masing 72,39% dan 71,12%.Abstract - Thesis is one of the requirements for graduation of a student. To determine the thesis theme, students can look for references from external sources from websites such as Research Gate, Springer, IEEE and Science Direct. Meanwhile, one of the internal reference sources is the ITATS library website which stores thesis documents that have been completed by ITATS students. In the ITATS Informatics Engineering Department there are 3 areas of interest that can be used as classes in the thesis document, namely Artificial Intelligence, Software Engineering, and Computer Networks. With the existence of 3 areas of interest, the proposed word weighting is TF.IDF.ICF where ICF carries out term weighting which paying attention to class (areas of interest) in the document. By weighting TF.IDF.ICF, the relevance of the search results is better than using TF.IDF with the mean average precision values 72.39% and 71.12%\",\"PeriodicalId\":53375,\"journal\":{\"name\":\"Jurnal Informatika Jurnal Pengembangan IT\",\"volume\":null,\"pages\":null},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2020-05-31\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"2\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Informatika Jurnal Pengembangan IT\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.30591/JPIT.V5I2.2079\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Informatika Jurnal Pengembangan IT","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.30591/JPIT.V5I2.2079","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2
摘要
圣经是获得学生认可的条件之一。为了确定脚本主题,学生可以从\网站上搜索外部来源的参考资料,如\ Research Gate、\ Springer、IEEE和\ Science Direct。其中一个内部参考来源是ITATS图书馆网站,该网站存储了ITATS学生完成的脚本文档。在ITATS IT技术流程中,有三个感兴趣的领域可以在脚本文档中进行分类:人工智能、软件设计和计算机网络。对于3个感兴趣的字段,则提议的单词撤销是TF.IDF.ICF,其中ICF执行撤销,以观察文档上的类(感兴趣的域)。删除TF.IDF.ICF后,搜索结果的相关性比使用TF.IDF要好,平均精度分别为72.39%和71.12%。摘要[UNK]-[UNK]是学生毕业的要求之一。为了确定论文主题,学生可以从Research Gate、Springer、IEEE和Science Direct等网站上寻找外部来源的参考资料。同时,其中一个内部参考来源是ITATS图书馆网站,该网站存储了ITATS学生完成的论文文档。在ITATS信息工程系,有3个感兴趣的课程可以用作论文文件中的课程,即人工智能、软件工程和计算机网络。在存在3个感兴趣的领域的情况下,所提出的单词权重是TF.IDF.ICF,其中ICF执行关注文档中的类别(感兴趣的区域)的术语权重。通过加权TF.IDF.ICF,搜索结果的相关性优于使用TF.IDF,平均精度值分别为72.39%和71.12%
Implementasi Vector Space Model Dengan Pembobotan Berbasis Kelas Pada Mesin Pencari Dokumen Skripsi
Skripsi merupakan salah satu persyaratan untuk kelulusan seorang mahasiswa. Untuk menentukan tema skripsi, mahasiswa dapat mencari referensi dari sumber eksternal dari website seperti Research Gate, Springer, IEEE dan Science Direct. Sedangkan salah satu sumber referensi internal yaitu website perpustakaan ITATS yang menyimpan dokumen skripsi yang sudah diselesaikan oleh Mahasiswa ITATS. Di Jurusan Teknik Informatika ITATS terdapat 3 bidang minat yang dapat dijadikan kelas pada dokumen skripsi yaitu Kecerdasan Buatan, Rekayasa Perangkat Lunak, dan Jaringan Komputer. Dengan adanya 3 bidang minat maka pembobotan kata yang diusulkan adalah TF.IDF.ICF dimana ICF melakukan pembobotan kata yang memperhatikan kelas (bidang minat) pada dokumen. Dengan pembobotan TF.IDF.ICF relevansi dari hasil pencarian lebih baik daripada menggunakan TF.IDF dengan nilai mean average precision masing-masing 72,39% dan 71,12%.Abstract - Thesis is one of the requirements for graduation of a student. To determine the thesis theme, students can look for references from external sources from websites such as Research Gate, Springer, IEEE and Science Direct. Meanwhile, one of the internal reference sources is the ITATS library website which stores thesis documents that have been completed by ITATS students. In the ITATS Informatics Engineering Department there are 3 areas of interest that can be used as classes in the thesis document, namely Artificial Intelligence, Software Engineering, and Computer Networks. With the existence of 3 areas of interest, the proposed word weighting is TF.IDF.ICF where ICF carries out term weighting which paying attention to class (areas of interest) in the document. By weighting TF.IDF.ICF, the relevance of the search results is better than using TF.IDF with the mean average precision values 72.39% and 71.12%