Юрій Олександрович Годлевський, Галина Вікторівна Марчук, Ірина Володимирівна Панаріна
{"title":"Аналіз, моделювання та прогнозування ціни будинків залежно від їх розмірів","authors":"Юрій Олександрович Годлевський, Галина Вікторівна Марчук, Ірина Володимирівна Панаріна","doi":"10.26642/ten-2022-2(90)-79-86","DOIUrl":null,"url":null,"abstract":"Мета аналізу даних – отримувати інформацію, яку непросто витлумачити, але яка, якщо її зрозуміти, допоможе правильно її використати. У статті описано новий підхід до використання інтелектуальних технологій для певних бізнес-рішень, а саме для дослідження цінової політики вартості будинків залежно від їх розмірів. Об’єктом дослідження є аналіз даних інформації про наявні в продажу будинки, їх розміри і вартість. Предметом дослідження є методи, алгоритми та засоби інтелектуального аналізу даних. У статті розглядається найбільш простий і зрозумілий, водночас часто використовуваний метод математичного програмування для вирішення завдань такого роду – метод градієнтного спуску (gradient descent). У роботі використана найбільш поширена функція втрат середньоквадратичної помилки. Похідна цієї функції показує обчислення градієнта для лінійної регресії. Використано лінійну регресію (Linear regression) – модель залежності змінних (вартості та площі будинку) з лінійною функцією залежності. Дані для аналізу були завантажені з декількох інтернет-ресурсів продажу та оренди житла. В статті представлено візуалізацію методу градієнтного спуску по функції помилки за двома параметрами. Крім 3D-графіків, у роботі представлені контурні графіки. Контурний графік – це метод представлення тривимірного зображення у двомірній площині, що добре представляє покрокову роботу методу градієнтного спуску. В результаті було спроєктовано модель, де можна побачити, як модель підлаштовується під тренувальні дані і готова виконувати своє завдання. Провівши тестування запропонованої моделі, можна виявити приблизну вартість будинку залежно від його розмірів. Функція помилки мінімізована і відповідає вимогам поставленого завдання. В подальшому планується збільшити кількість вхідних даних для аналізу, вказавши місце розташування, кількість кімнат, величину прилеглої території.","PeriodicalId":33761,"journal":{"name":"Tekhnichna inzheneriia","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-12-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Tekhnichna inzheneriia","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26642/ten-2022-2(90)-79-86","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2
Abstract
Мета аналізу даних – отримувати інформацію, яку непросто витлумачити, але яка, якщо її зрозуміти, допоможе правильно її використати. У статті описано новий підхід до використання інтелектуальних технологій для певних бізнес-рішень, а саме для дослідження цінової політики вартості будинків залежно від їх розмірів. Об’єктом дослідження є аналіз даних інформації про наявні в продажу будинки, їх розміри і вартість. Предметом дослідження є методи, алгоритми та засоби інтелектуального аналізу даних. У статті розглядається найбільш простий і зрозумілий, водночас часто використовуваний метод математичного програмування для вирішення завдань такого роду – метод градієнтного спуску (gradient descent). У роботі використана найбільш поширена функція втрат середньоквадратичної помилки. Похідна цієї функції показує обчислення градієнта для лінійної регресії. Використано лінійну регресію (Linear regression) – модель залежності змінних (вартості та площі будинку) з лінійною функцією залежності. Дані для аналізу були завантажені з декількох інтернет-ресурсів продажу та оренди житла. В статті представлено візуалізацію методу градієнтного спуску по функції помилки за двома параметрами. Крім 3D-графіків, у роботі представлені контурні графіки. Контурний графік – це метод представлення тривимірного зображення у двомірній площині, що добре представляє покрокову роботу методу градієнтного спуску. В результаті було спроєктовано модель, де можна побачити, як модель підлаштовується під тренувальні дані і готова виконувати своє завдання. Провівши тестування запропонованої моделі, можна виявити приблизну вартість будинку залежно від його розмірів. Функція помилки мінімізована і відповідає вимогам поставленого завдання. В подальшому планується збільшити кількість вхідних даних для аналізу, вказавши місце розташування, кількість кімнат, величину прилеглої території.