{"title":"分析机器学习调整大小技术","authors":"Н. Е. Кондрук","doi":"10.24144/2616-7700.2023.42(1).181-187","DOIUrl":null,"url":null,"abstract":"Багато сучасних наборiв даних мають високу розмiрнiсть, яка може призводити до\n проблем з перевантаженням моделей, зменшенням ефективностi обробки даних та збiльшення\n часу навчання. Тому дослiдження застосування технiк зменшення розмiрностi даних є\n важливою задачею для покращення продуктивностi та швидкостi аналiзу. В роботi проведено\n огляд та оцiнка ефективностi сучасних технiк для зменшення розмiрностi високорозмiрного\n ознакового простору даних з метою вiзуалiзацiї та попередньої обробки даних. Для цього\n розроблено iнформацiйно-аналiтичну систему на Python, що реалiзує PSA, t-SNE, Isomap,\n UMAP. В якостi тестового набору даних був обраний високорозмiрний набiр «DARWIN» з 451\n ознакою. В результатi експерименту всi технiки в цiлому показали подiбнi результати\n вiзуалiзацiї даних. t-SNE виявився найефективнiшим методом попередньої обробки даних для\n цього датасету, покращивши точнiсть kNN на 21% i SVC на 4%. Отриманi результати\n доводять, що застосування сучасних методiв зменшення розмiрностi даних може сприяти\n побудовi бiльш ефективних моделей та прогнозiв. Майбутнi дослiдження передбачають оцiнку\n синергiї технiк аналiзу даних та машинного навчання для вирiшення конкретних прикладних\n задач.","PeriodicalId":33567,"journal":{"name":"Naukovii visnik Uzhgorods''kogo universitetu Seriia Matematika i informatika","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-05-04","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Аналіз технік зменшення розмірності в машинному навчанні\",\"authors\":\"Н. Е. Кондрук\",\"doi\":\"10.24144/2616-7700.2023.42(1).181-187\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Багато сучасних наборiв даних мають високу розмiрнiсть, яка може призводити до\\n проблем з перевантаженням моделей, зменшенням ефективностi обробки даних та збiльшення\\n часу навчання. Тому дослiдження застосування технiк зменшення розмiрностi даних є\\n важливою задачею для покращення продуктивностi та швидкостi аналiзу. В роботi проведено\\n огляд та оцiнка ефективностi сучасних технiк для зменшення розмiрностi високорозмiрного\\n ознакового простору даних з метою вiзуалiзацiї та попередньої обробки даних. Для цього\\n розроблено iнформацiйно-аналiтичну систему на Python, що реалiзує PSA, t-SNE, Isomap,\\n UMAP. В якостi тестового набору даних був обраний високорозмiрний набiр «DARWIN» з 451\\n ознакою. В результатi експерименту всi технiки в цiлому показали подiбнi результати\\n вiзуалiзацiї даних. t-SNE виявився найефективнiшим методом попередньої обробки даних для\\n цього датасету, покращивши точнiсть kNN на 21% i SVC на 4%. Отриманi результати\\n доводять, що застосування сучасних методiв зменшення розмiрностi даних може сприяти\\n побудовi бiльш ефективних моделей та прогнозiв. Майбутнi дослiдження передбачають оцiнку\\n синергiї технiк аналiзу даних та машинного навчання для вирiшення конкретних прикладних\\n задач.\",\"PeriodicalId\":33567,\"journal\":{\"name\":\"Naukovii visnik Uzhgorods''kogo universitetu Seriia Matematika i informatika\",\"volume\":\" \",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-05-04\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Naukovii visnik Uzhgorods''kogo universitetu Seriia Matematika i informatika\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.24144/2616-7700.2023.42(1).181-187\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Naukovii visnik Uzhgorods''kogo universitetu Seriia Matematika i informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24144/2616-7700.2023.42(1).181-187","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Аналіз технік зменшення розмірності в машинному навчанні
Багато сучасних наборiв даних мають високу розмiрнiсть, яка може призводити до
проблем з перевантаженням моделей, зменшенням ефективностi обробки даних та збiльшення
часу навчання. Тому дослiдження застосування технiк зменшення розмiрностi даних є
важливою задачею для покращення продуктивностi та швидкостi аналiзу. В роботi проведено
огляд та оцiнка ефективностi сучасних технiк для зменшення розмiрностi високорозмiрного
ознакового простору даних з метою вiзуалiзацiї та попередньої обробки даних. Для цього
розроблено iнформацiйно-аналiтичну систему на Python, що реалiзує PSA, t-SNE, Isomap,
UMAP. В якостi тестового набору даних був обраний високорозмiрний набiр «DARWIN» з 451
ознакою. В результатi експерименту всi технiки в цiлому показали подiбнi результати
вiзуалiзацiї даних. t-SNE виявився найефективнiшим методом попередньої обробки даних для
цього датасету, покращивши точнiсть kNN на 21% i SVC на 4%. Отриманi результати
доводять, що застосування сучасних методiв зменшення розмiрностi даних може сприяти
побудовi бiльш ефективних моделей та прогнозiв. Майбутнi дослiдження передбачають оцiнку
синергiї технiк аналiзу даних та машинного навчання для вирiшення конкретних прикладних
задач.