基于分类方法的运输方式选择分析

N. Zenina, A. Borisov
{"title":"基于分类方法的运输方式选择分析","authors":"N. Zenina, A. Borisov","doi":"10.2478/v10143-011-0041-2","DOIUrl":null,"url":null,"abstract":"Transportation Mode Choice Analysis Based on Classification Methods Mode choice analysis has received the most attention among discrete choice problems in travel behavior literature. Most traditional mode choice models are based on the principle of random utility maximization derived from econometric theory. This paper investigates performance of mode choice analysis with classification methods - decision trees, discriminant analysis and multinomial logit. Experimental results have demonstrated satisfactory quality of classification. Transportlīdzekļu pārvietošanās veidu analīze, pamatojoties uz klasifikācijas metodēm Transportlīdzekļu veidu izvēle diskrēto uzdevumu vidē ir plaši atspoguļota literatūrā. Transportlīdzekļu veidu izvēle un prognoze ir cieši saistīti ar transporta sistēmas politiku, braucienu pieprasījuma vadību un ar sastrēgumu samazinājuma stratēgiju uz ceļiem. Darbā ir izskatīti lēmumu koki (algoritmi C4.5 un CART), diskriminantu analīze un daudzdimensiju logit regresija transportlīdzekļu veidu (mašīna, gājējs, sabiedriskais transports, taksometrs un riteņbraucējs) pārvietošanās analīzei. Lēmumu koku klasifikācijas rezultāti parādīja, ka 67% - 78% eksemplāru bija klasificēti pareizi. Papildus apstrādājot izejas datus, kombinējot vairākus filtrus, pareizi klasificēto eksemplāru skaits tika palielināts līdz 80% algoritmam C4.5 un līdz 92% algoritmam CART. Tiešā un soļu diskriminantu analīze parādīja nebūtisku atšķirību pareizi klasificēto eksemplāru skaitā. Soļu diskriminantu analīzes gadījumā pareizi tika identificēta piederība 64.1% novērojumu un 63.9% klasifikācijai ņemot vērā visus mainīgos vienlaicīgi. Klasifikācijas rezultātu ne sevišķi lielā precizitāte bija saistīta ar kategorijām \"taksometrs\" un \"riteņbraucējs\" atkarīgā mainīgā \"transportlīdzekļu pārvietošanās veids\". Samazinot kategoriju skaitu līdz trim (bez kategorijām \"taksometri\" un \"riteņbraucējs\") klasifikācijas precizitāte palielinājās līdz 79.6% soļu un tiešajai diskriminantu analīzei. Daudzdimensiju logistiskās regresijas klasifikācijas rezultāti uzrādīja, ka 88.6% respondentu tika klasificēti pareizi. Uzbūvētā modeļa lielā statistiskā nozīme liecina par to augsto kvalitāti un piemērotību uzdevuma risināšanai. Анализ транспортных средств передвижения с помощью классификационных методов Выбор вида перемещения (mode choice) среди дискретных задач выбора наиболее широко отражен в литературе. Выбор и прогнозирование вида передвижения тесно связаны с политикой транспортной системы, управлением спроса на поездки и стратегией уменьшения заторов на дорогах. В данной работе рассматриваются деревья решений (алгоритмы C4.5 и CART), дискриминантный анализ и множественная логит регрессия для анализа выбора средства передвижения (на машине, пешком, общественный транспорт, такси или на велосипеде). Результаты классификации с помощью деревьев решений показали 67% - 78% верно классифицированных экземпляров на тестируемом множестве. Дополнительно обработав исходные данные, комбинируя несколько фильтров, удалось повысить процент верно классифицируемых экземпляров до 80% для алгоритма C4.5 и до 92% для алгоритма CART. Сравнительные результаты прямого метода и пошагового дискриминантного анализа показали незначительную разницу верно классифицированных наблюдений. В случае пошагового дискриминантного анализа правильно определена принадлежность 64,1% наблюдений и 63,9% при классификации с учетом всех независимых переменных одновременно. Невысокая точность классификации связана с категориями такси и велосипед зависимой переменной тип перемещения. Уменьшение категорий с пяти до трех (без категорий такси и велосипед) увеличило точность классификации на 79,6% для пошагового дискриминантного анализа, и до 79,8% для классификации с учетом всех независимых переменных одновременно. Результаты множественной логистической регрессии показали, что 88,6% респондентов были классифицированы верно. Высокая статистическая значимость построенной модели, основанная на методе максимального правдоподобия (Sig. < 0,001), свидетельствует о ее высоком качестве и пригодности для решения поставленной задачи.","PeriodicalId":211660,"journal":{"name":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","volume":"16 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"8","resultStr":"{\"title\":\"Transportation Mode Choice Analysis Based on Classification Methods\",\"authors\":\"N. Zenina, A. Borisov\",\"doi\":\"10.2478/v10143-011-0041-2\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Transportation Mode Choice Analysis Based on Classification Methods Mode choice analysis has received the most attention among discrete choice problems in travel behavior literature. Most traditional mode choice models are based on the principle of random utility maximization derived from econometric theory. This paper investigates performance of mode choice analysis with classification methods - decision trees, discriminant analysis and multinomial logit. Experimental results have demonstrated satisfactory quality of classification. Transportlīdzekļu pārvietošanās veidu analīze, pamatojoties uz klasifikācijas metodēm Transportlīdzekļu veidu izvēle diskrēto uzdevumu vidē ir plaši atspoguļota literatūrā. Transportlīdzekļu veidu izvēle un prognoze ir cieši saistīti ar transporta sistēmas politiku, braucienu pieprasījuma vadību un ar sastrēgumu samazinājuma stratēgiju uz ceļiem. Darbā ir izskatīti lēmumu koki (algoritmi C4.5 un CART), diskriminantu analīze un daudzdimensiju logit regresija transportlīdzekļu veidu (mašīna, gājējs, sabiedriskais transports, taksometrs un riteņbraucējs) pārvietošanās analīzei. Lēmumu koku klasifikācijas rezultāti parādīja, ka 67% - 78% eksemplāru bija klasificēti pareizi. Papildus apstrādājot izejas datus, kombinējot vairākus filtrus, pareizi klasificēto eksemplāru skaits tika palielināts līdz 80% algoritmam C4.5 un līdz 92% algoritmam CART. Tiešā un soļu diskriminantu analīze parādīja nebūtisku atšķirību pareizi klasificēto eksemplāru skaitā. Soļu diskriminantu analīzes gadījumā pareizi tika identificēta piederība 64.1% novērojumu un 63.9% klasifikācijai ņemot vērā visus mainīgos vienlaicīgi. Klasifikācijas rezultātu ne sevišķi lielā precizitāte bija saistīta ar kategorijām \\\"taksometrs\\\" un \\\"riteņbraucējs\\\" atkarīgā mainīgā \\\"transportlīdzekļu pārvietošanās veids\\\". Samazinot kategoriju skaitu līdz trim (bez kategorijām \\\"taksometri\\\" un \\\"riteņbraucējs\\\") klasifikācijas precizitāte palielinājās līdz 79.6% soļu un tiešajai diskriminantu analīzei. Daudzdimensiju logistiskās regresijas klasifikācijas rezultāti uzrādīja, ka 88.6% respondentu tika klasificēti pareizi. Uzbūvētā modeļa lielā statistiskā nozīme liecina par to augsto kvalitāti un piemērotību uzdevuma risināšanai. Анализ транспортных средств передвижения с помощью классификационных методов Выбор вида перемещения (mode choice) среди дискретных задач выбора наиболее широко отражен в литературе. Выбор и прогнозирование вида передвижения тесно связаны с политикой транспортной системы, управлением спроса на поездки и стратегией уменьшения заторов на дорогах. В данной работе рассматриваются деревья решений (алгоритмы C4.5 и CART), дискриминантный анализ и множественная логит регрессия для анализа выбора средства передвижения (на машине, пешком, общественный транспорт, такси или на велосипеде). Результаты классификации с помощью деревьев решений показали 67% - 78% верно классифицированных экземпляров на тестируемом множестве. Дополнительно обработав исходные данные, комбинируя несколько фильтров, удалось повысить процент верно классифицируемых экземпляров до 80% для алгоритма C4.5 и до 92% для алгоритма CART. Сравнительные результаты прямого метода и пошагового дискриминантного анализа показали незначительную разницу верно классифицированных наблюдений. В случае пошагового дискриминантного анализа правильно определена принадлежность 64,1% наблюдений и 63,9% при классификации с учетом всех независимых переменных одновременно. Невысокая точность классификации связана с категориями такси и велосипед зависимой переменной тип перемещения. Уменьшение категорий с пяти до трех (без категорий такси и велосипед) увеличило точность классификации на 79,6% для пошагового дискриминантного анализа, и до 79,8% для классификации с учетом всех независимых переменных одновременно. Результаты множественной логистической регрессии показали, что 88,6% респондентов были классифицированы верно. Высокая статистическая значимость построенной модели, основанная на методе максимального правдоподобия (Sig. < 0,001), свидетельствует о ее высоком качестве и пригодности для решения поставленной задачи.\",\"PeriodicalId\":211660,\"journal\":{\"name\":\"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.\",\"volume\":\"16 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"1900-01-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"8\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.2478/v10143-011-0041-2\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.2478/v10143-011-0041-2","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 8

摘要

基于分类方法的交通模式选择分析 在旅行行为文献中,模式选择分析是离散选择问题中最受关注的。传统的模式选择模型大多基于计量经济学理论中的随机效用最大化原则。本文利用决策树、判别分析和多叉 Logit 等分类方法研究了模式选择分析的性能。实验结果表明,分类质量令人满意。Transportlīdzekļu pārvietošanās veidu analīze, pamatojoties uz klasifikācijas metodēm Transportlīdzekļu veidu izvēle diskrēto uzdevumu vidē ir plaši atspoguļota literatūrā.运输政策、运输方案和运输战略的制定和实施是一项长期的任务。在此基础上,我们使用 C4.5 和 CART 算法、磁盘阵列分析法和对数回归法对运输工具进行了分析(运输工具、运输工具、危险品运输工具、运输工具和运输工具)。在全球范围内,67%-78%的样本都具有分析能力。通过对数据进行筛选、组合和过滤,对 80% 的 C4.5 算法和 92% 的 CART 算法的样本进行分析。该分析法的特点是通过对样本的分析来进行判别。64.1%的新移民和63.9%的受过良好教育的移民都认为自己是主要群体。我们的研究结果表明,在 "文化 "和 "仪式 "分类中,"运输 "和 "建筑 "的分类是准确的。在 "taksometri "和 "riteņbraucējs "分类中,精确度为 79.6%的分类数据被分析。88.6%的受访者对物流服务的结果表示满意。统计模式的选择可以提高统计结果的价值。离散选择问题中的模式选择是文献中报道最多的问题。模式选择和预测与交通系统政策、出行需求管理和缓解拥堵策略密切相关。本文采用决策树(C4.5 和 CART 算法)、判别分析和多元对数回归来分析出行方式(开车、步行、公共交通、出租车或自行车)的选择。使用决策树的分类结果显示,测试集上有 67% 至 78% 的实例被正确分类。通过结合多个过滤器对原始数据进行进一步处理,可以将 C4.5 算法的正确分类率提高到 80%,将 CART 算法的正确分类率提高到 92%。直接法和逐步判别分析法的比较结果显示,正确分类观测值的差异可以忽略不计。在逐步判别分析法中,64.1% 的观测值被正确识别,而在同时考虑所有自变量的情况下,63.9% 的观测值被正确识别。分类准确率低与因变量运动类型中的出租车和自行车类别有关。将类别从五个减少到三个(不包括出租车和自行车类别),逐步判别分析的分类准确率提高了 79.6%,同时考虑所有自变量的分类准确率提高了 79.8%。多元逻辑回归结果显示,88.6% 的受访者被正确分类。基于最大似然法构建的模型具有很高的统计显著性(Sig. < 0.001),表明其质量很高,适合当前任务。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Transportation Mode Choice Analysis Based on Classification Methods
Transportation Mode Choice Analysis Based on Classification Methods Mode choice analysis has received the most attention among discrete choice problems in travel behavior literature. Most traditional mode choice models are based on the principle of random utility maximization derived from econometric theory. This paper investigates performance of mode choice analysis with classification methods - decision trees, discriminant analysis and multinomial logit. Experimental results have demonstrated satisfactory quality of classification. Transportlīdzekļu pārvietošanās veidu analīze, pamatojoties uz klasifikācijas metodēm Transportlīdzekļu veidu izvēle diskrēto uzdevumu vidē ir plaši atspoguļota literatūrā. Transportlīdzekļu veidu izvēle un prognoze ir cieši saistīti ar transporta sistēmas politiku, braucienu pieprasījuma vadību un ar sastrēgumu samazinājuma stratēgiju uz ceļiem. Darbā ir izskatīti lēmumu koki (algoritmi C4.5 un CART), diskriminantu analīze un daudzdimensiju logit regresija transportlīdzekļu veidu (mašīna, gājējs, sabiedriskais transports, taksometrs un riteņbraucējs) pārvietošanās analīzei. Lēmumu koku klasifikācijas rezultāti parādīja, ka 67% - 78% eksemplāru bija klasificēti pareizi. Papildus apstrādājot izejas datus, kombinējot vairākus filtrus, pareizi klasificēto eksemplāru skaits tika palielināts līdz 80% algoritmam C4.5 un līdz 92% algoritmam CART. Tiešā un soļu diskriminantu analīze parādīja nebūtisku atšķirību pareizi klasificēto eksemplāru skaitā. Soļu diskriminantu analīzes gadījumā pareizi tika identificēta piederība 64.1% novērojumu un 63.9% klasifikācijai ņemot vērā visus mainīgos vienlaicīgi. Klasifikācijas rezultātu ne sevišķi lielā precizitāte bija saistīta ar kategorijām "taksometrs" un "riteņbraucējs" atkarīgā mainīgā "transportlīdzekļu pārvietošanās veids". Samazinot kategoriju skaitu līdz trim (bez kategorijām "taksometri" un "riteņbraucējs") klasifikācijas precizitāte palielinājās līdz 79.6% soļu un tiešajai diskriminantu analīzei. Daudzdimensiju logistiskās regresijas klasifikācijas rezultāti uzrādīja, ka 88.6% respondentu tika klasificēti pareizi. Uzbūvētā modeļa lielā statistiskā nozīme liecina par to augsto kvalitāti un piemērotību uzdevuma risināšanai. Анализ транспортных средств передвижения с помощью классификационных методов Выбор вида перемещения (mode choice) среди дискретных задач выбора наиболее широко отражен в литературе. Выбор и прогнозирование вида передвижения тесно связаны с политикой транспортной системы, управлением спроса на поездки и стратегией уменьшения заторов на дорогах. В данной работе рассматриваются деревья решений (алгоритмы C4.5 и CART), дискриминантный анализ и множественная логит регрессия для анализа выбора средства передвижения (на машине, пешком, общественный транспорт, такси или на велосипеде). Результаты классификации с помощью деревьев решений показали 67% - 78% верно классифицированных экземпляров на тестируемом множестве. Дополнительно обработав исходные данные, комбинируя несколько фильтров, удалось повысить процент верно классифицируемых экземпляров до 80% для алгоритма C4.5 и до 92% для алгоритма CART. Сравнительные результаты прямого метода и пошагового дискриминантного анализа показали незначительную разницу верно классифицированных наблюдений. В случае пошагового дискриминантного анализа правильно определена принадлежность 64,1% наблюдений и 63,9% при классификации с учетом всех независимых переменных одновременно. Невысокая точность классификации связана с категориями такси и велосипед зависимой переменной тип перемещения. Уменьшение категорий с пяти до трех (без категорий такси и велосипед) увеличило точность классификации на 79,6% для пошагового дискриминантного анализа, и до 79,8% для классификации с учетом всех независимых переменных одновременно. Результаты множественной логистической регрессии показали, что 88,6% респондентов были классифицированы верно. Высокая статистическая значимость построенной модели, основанная на методе максимального правдоподобия (Sig. < 0,001), свидетельствует о ее высоком качестве и пригодности для решения поставленной задачи.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信