Аналіз, моделювання та прогнозування ціни будинків залежно від їх розмірів

Юрій Олександрович Годлевський, Галина Вікторівна Марчук, Ірина Володимирівна Панаріна
{"title":"Аналіз, моделювання та прогнозування ціни будинків залежно від їх розмірів","authors":"Юрій Олександрович Годлевський, Галина Вікторівна Марчук, Ірина Володимирівна Панаріна","doi":"10.26642/ten-2022-2(90)-79-86","DOIUrl":null,"url":null,"abstract":"Мета аналізу даних – отримувати інформацію, яку непросто витлумачити, але яка, якщо її зрозуміти, допоможе правильно її використати. У статті описано новий підхід до використання  інтелектуальних технологій для певних бізнес-рішень, а саме для дослідження цінової політики вартості будинків залежно від їх розмірів. Об’єктом дослідження є аналіз даних інформації про наявні в продажу будинки, їх розміри і вартість. Предметом дослідження є методи, алгоритми та засоби інтелектуального аналізу даних. У статті розглядається найбільш простий і зрозумілий, водночас часто використовуваний метод математичного програмування для вирішення завдань такого роду – метод градієнтного спуску (gradient descent). У роботі використана найбільш поширена функція втрат середньоквадратичної помилки. Похідна цієї функції показує обчислення градієнта для лінійної регресії. Використано лінійну регресію (Linear regression) – модель залежності змінних (вартості та площі будинку) з лінійною функцією залежності. Дані для аналізу були завантажені з декількох інтернет-ресурсів продажу та оренди житла. В статті представлено візуалізацію методу градієнтного спуску по функції помилки за двома параметрами. Крім 3D-графіків, у роботі представлені контурні графіки. Контурний графік – це метод представлення тривимірного зображення у двомірній площині, що добре представляє покрокову роботу методу градієнтного спуску. В результаті було спроєктовано модель, де можна побачити, як модель підлаштовується під тренувальні дані і готова виконувати своє завдання. Провівши тестування запропонованої моделі, можна виявити приблизну вартість будинку залежно від його розмірів. Функція помилки мінімізована і відповідає вимогам поставленого завдання. В подальшому планується збільшити кількість вхідних даних для аналізу, вказавши місце розташування, кількість кімнат, величину прилеглої території.","PeriodicalId":33761,"journal":{"name":"Tekhnichna inzheneriia","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-12-19","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Tekhnichna inzheneriia","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26642/ten-2022-2(90)-79-86","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2

Abstract

Мета аналізу даних – отримувати інформацію, яку непросто витлумачити, але яка, якщо її зрозуміти, допоможе правильно її використати. У статті описано новий підхід до використання  інтелектуальних технологій для певних бізнес-рішень, а саме для дослідження цінової політики вартості будинків залежно від їх розмірів. Об’єктом дослідження є аналіз даних інформації про наявні в продажу будинки, їх розміри і вартість. Предметом дослідження є методи, алгоритми та засоби інтелектуального аналізу даних. У статті розглядається найбільш простий і зрозумілий, водночас часто використовуваний метод математичного програмування для вирішення завдань такого роду – метод градієнтного спуску (gradient descent). У роботі використана найбільш поширена функція втрат середньоквадратичної помилки. Похідна цієї функції показує обчислення градієнта для лінійної регресії. Використано лінійну регресію (Linear regression) – модель залежності змінних (вартості та площі будинку) з лінійною функцією залежності. Дані для аналізу були завантажені з декількох інтернет-ресурсів продажу та оренди житла. В статті представлено візуалізацію методу градієнтного спуску по функції помилки за двома параметрами. Крім 3D-графіків, у роботі представлені контурні графіки. Контурний графік – це метод представлення тривимірного зображення у двомірній площині, що добре представляє покрокову роботу методу градієнтного спуску. В результаті було спроєктовано модель, де можна побачити, як модель підлаштовується під тренувальні дані і готова виконувати своє завдання. Провівши тестування запропонованої моделі, можна виявити приблизну вартість будинку залежно від його розмірів. Функція помилки мінімізована і відповідає вимогам поставленого завдання. В подальшому планується збільшити кількість вхідних даних для аналізу, вказавши місце розташування, кількість кімнат, величину прилеглої території.
根据房屋大小分析、建模和预测房价
数据分析的目的是获得不容易解释的信息,但如果理解了这些信息,将有助于正确使用这些信息。这篇文章描述了一种将智能技术用于某些商业决策的新方法,即根据家庭规模调查家庭的价格政策。本研究的目的是分析有关房屋销售、面积和成本的信息。这项研究是关于智能数据分析的方法、算法和工具。这篇文章着眼于最简单、最容易理解的数学规划方法,它通常用于解决这类任务:梯度下降。使用了最常见的中间误差函数。此函数的开头显示了线性回归的梯度计算。使用的线性回归是一个具有线性依赖函数的变量依赖模型。用于分析的数据是从几家在线销售和租赁公司下载的。本文介绍了在两种设置中通过误差函数实现梯度下降方法的可视化。除了三维图形外,该作品还展示了等高线图。控制图是一种在二维区域中表示三维图像的方法,它很好地代表了梯度下降方法的姿态工作。因此,设计了一个模型来查看该模型如何适应训练数据,并准备好完成其工作。在测试拟议的模型时,你可以根据房子的大小找到房子的大致成本。误差函数被最小化并且满足给定任务的要求。现在计划通过指定位置、房间数量和相邻区域的大小来增加用于分析的输入数据的数量。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
21
审稿时长
5 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信