Zicola Vladimir VIky Khan, Derry Alamsyah, Wijang Widhiarso
{"title":"DBSCAN方法论文主题分类","authors":"Zicola Vladimir VIky Khan, Derry Alamsyah, Wijang Widhiarso","doi":"10.35957/algoritme.v3i1.3337","DOIUrl":null,"url":null,"abstract":"Penelitian ini menganalisis 176 skripsi mahasiswa universitas swasta di Palembang tahun 2020. Data dianalisis dengan melakukan text processing dan ekstraksi menggunakan TF-IDF dengan 2 skenario, yakni fitur yang direduksi dan tidak direduksi dengan metode SVD. Tiap skenario digunakan 3 metric yakni cosine, euclidean, dan manhattan, sehingga total skenario menjadi 6. Hasil yang ditemukan bahwa kualitas klaster terbaik yang diukur dengan silhouette coefficient berasal dari metric cosine dan fitur yang direduksi oleh SVD dengan nilai silhouette coefficient 0.88382763, nilai intracluster sebesar 0.08688583, dan nilai intercluster sebesar 0.74671096. Di sisi lain, kualitas klaster untuk fitur yang direduksi lebih baik dibandingkan dengan fitur yang tidak direduksi. Selain itu, penggunaan DBSCAN menunjukan korelasi yang positif antara epsilon dan intracluster dengan nilai 0.97669, dan menunjukan korelasi yang negatif antara epsilon dan silhouette dengan nilai 0.9789. \n ","PeriodicalId":447117,"journal":{"name":"Jurnal Algoritme","volume":"17 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-10-05","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Klasterisasi Topik Skripsi Informatika dengan Metode DBSCAN\",\"authors\":\"Zicola Vladimir VIky Khan, Derry Alamsyah, Wijang Widhiarso\",\"doi\":\"10.35957/algoritme.v3i1.3337\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Penelitian ini menganalisis 176 skripsi mahasiswa universitas swasta di Palembang tahun 2020. Data dianalisis dengan melakukan text processing dan ekstraksi menggunakan TF-IDF dengan 2 skenario, yakni fitur yang direduksi dan tidak direduksi dengan metode SVD. Tiap skenario digunakan 3 metric yakni cosine, euclidean, dan manhattan, sehingga total skenario menjadi 6. Hasil yang ditemukan bahwa kualitas klaster terbaik yang diukur dengan silhouette coefficient berasal dari metric cosine dan fitur yang direduksi oleh SVD dengan nilai silhouette coefficient 0.88382763, nilai intracluster sebesar 0.08688583, dan nilai intercluster sebesar 0.74671096. Di sisi lain, kualitas klaster untuk fitur yang direduksi lebih baik dibandingkan dengan fitur yang tidak direduksi. Selain itu, penggunaan DBSCAN menunjukan korelasi yang positif antara epsilon dan intracluster dengan nilai 0.97669, dan menunjukan korelasi yang negatif antara epsilon dan silhouette dengan nilai 0.9789. \\n \",\"PeriodicalId\":447117,\"journal\":{\"name\":\"Jurnal Algoritme\",\"volume\":\"17 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-10-05\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Algoritme\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.35957/algoritme.v3i1.3337\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Algoritme","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.35957/algoritme.v3i1.3337","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Klasterisasi Topik Skripsi Informatika dengan Metode DBSCAN
Penelitian ini menganalisis 176 skripsi mahasiswa universitas swasta di Palembang tahun 2020. Data dianalisis dengan melakukan text processing dan ekstraksi menggunakan TF-IDF dengan 2 skenario, yakni fitur yang direduksi dan tidak direduksi dengan metode SVD. Tiap skenario digunakan 3 metric yakni cosine, euclidean, dan manhattan, sehingga total skenario menjadi 6. Hasil yang ditemukan bahwa kualitas klaster terbaik yang diukur dengan silhouette coefficient berasal dari metric cosine dan fitur yang direduksi oleh SVD dengan nilai silhouette coefficient 0.88382763, nilai intracluster sebesar 0.08688583, dan nilai intercluster sebesar 0.74671096. Di sisi lain, kualitas klaster untuk fitur yang direduksi lebih baik dibandingkan dengan fitur yang tidak direduksi. Selain itu, penggunaan DBSCAN menunjukan korelasi yang positif antara epsilon dan intracluster dengan nilai 0.97669, dan menunjukan korelasi yang negatif antara epsilon dan silhouette dengan nilai 0.9789.