{"title":"Transportation Mode Choice Analysis Based on Classification Methods","authors":"N. Zenina, A. Borisov","doi":"10.2478/v10143-011-0041-2","DOIUrl":null,"url":null,"abstract":"Transportation Mode Choice Analysis Based on Classification Methods Mode choice analysis has received the most attention among discrete choice problems in travel behavior literature. Most traditional mode choice models are based on the principle of random utility maximization derived from econometric theory. This paper investigates performance of mode choice analysis with classification methods - decision trees, discriminant analysis and multinomial logit. Experimental results have demonstrated satisfactory quality of classification. Transportlīdzekļu pārvietošanās veidu analīze, pamatojoties uz klasifikācijas metodēm Transportlīdzekļu veidu izvēle diskrēto uzdevumu vidē ir plaši atspoguļota literatūrā. Transportlīdzekļu veidu izvēle un prognoze ir cieši saistīti ar transporta sistēmas politiku, braucienu pieprasījuma vadību un ar sastrēgumu samazinājuma stratēgiju uz ceļiem. Darbā ir izskatīti lēmumu koki (algoritmi C4.5 un CART), diskriminantu analīze un daudzdimensiju logit regresija transportlīdzekļu veidu (mašīna, gājējs, sabiedriskais transports, taksometrs un riteņbraucējs) pārvietošanās analīzei. Lēmumu koku klasifikācijas rezultāti parādīja, ka 67% - 78% eksemplāru bija klasificēti pareizi. Papildus apstrādājot izejas datus, kombinējot vairākus filtrus, pareizi klasificēto eksemplāru skaits tika palielināts līdz 80% algoritmam C4.5 un līdz 92% algoritmam CART. Tiešā un soļu diskriminantu analīze parādīja nebūtisku atšķirību pareizi klasificēto eksemplāru skaitā. Soļu diskriminantu analīzes gadījumā pareizi tika identificēta piederība 64.1% novērojumu un 63.9% klasifikācijai ņemot vērā visus mainīgos vienlaicīgi. Klasifikācijas rezultātu ne sevišķi lielā precizitāte bija saistīta ar kategorijām \"taksometrs\" un \"riteņbraucējs\" atkarīgā mainīgā \"transportlīdzekļu pārvietošanās veids\". Samazinot kategoriju skaitu līdz trim (bez kategorijām \"taksometri\" un \"riteņbraucējs\") klasifikācijas precizitāte palielinājās līdz 79.6% soļu un tiešajai diskriminantu analīzei. Daudzdimensiju logistiskās regresijas klasifikācijas rezultāti uzrādīja, ka 88.6% respondentu tika klasificēti pareizi. Uzbūvētā modeļa lielā statistiskā nozīme liecina par to augsto kvalitāti un piemērotību uzdevuma risināšanai. Анализ транспортных средств передвижения с помощью классификационных методов Выбор вида перемещения (mode choice) среди дискретных задач выбора наиболее широко отражен в литературе. Выбор и прогнозирование вида передвижения тесно связаны с политикой транспортной системы, управлением спроса на поездки и стратегией уменьшения заторов на дорогах. В данной работе рассматриваются деревья решений (алгоритмы C4.5 и CART), дискриминантный анализ и множественная логит регрессия для анализа выбора средства передвижения (на машине, пешком, общественный транспорт, такси или на велосипеде). Результаты классификации с помощью деревьев решений показали 67% - 78% верно классифицированных экземпляров на тестируемом множестве. Дополнительно обработав исходные данные, комбинируя несколько фильтров, удалось повысить процент верно классифицируемых экземпляров до 80% для алгоритма C4.5 и до 92% для алгоритма CART. Сравнительные результаты прямого метода и пошагового дискриминантного анализа показали незначительную разницу верно классифицированных наблюдений. В случае пошагового дискриминантного анализа правильно определена принадлежность 64,1% наблюдений и 63,9% при классификации с учетом всех независимых переменных одновременно. Невысокая точность классификации связана с категориями такси и велосипед зависимой переменной тип перемещения. Уменьшение категорий с пяти до трех (без категорий такси и велосипед) увеличило точность классификации на 79,6% для пошагового дискриминантного анализа, и до 79,8% для классификации с учетом всех независимых переменных одновременно. Результаты множественной логистической регрессии показали, что 88,6% респондентов были классифицированы верно. Высокая статистическая значимость построенной модели, основанная на методе максимального правдоподобия (Sig. < 0,001), свидетельствует о ее высоком качестве и пригодности для решения поставленной задачи.","PeriodicalId":211660,"journal":{"name":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","volume":"16 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"1900-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"8","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Sci. J. Riga Tech. Univ. Ser. Comput. Sci.","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.2478/v10143-011-0041-2","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 8
Abstract
Transportation Mode Choice Analysis Based on Classification Methods Mode choice analysis has received the most attention among discrete choice problems in travel behavior literature. Most traditional mode choice models are based on the principle of random utility maximization derived from econometric theory. This paper investigates performance of mode choice analysis with classification methods - decision trees, discriminant analysis and multinomial logit. Experimental results have demonstrated satisfactory quality of classification. Transportlīdzekļu pārvietošanās veidu analīze, pamatojoties uz klasifikācijas metodēm Transportlīdzekļu veidu izvēle diskrēto uzdevumu vidē ir plaši atspoguļota literatūrā. Transportlīdzekļu veidu izvēle un prognoze ir cieši saistīti ar transporta sistēmas politiku, braucienu pieprasījuma vadību un ar sastrēgumu samazinājuma stratēgiju uz ceļiem. Darbā ir izskatīti lēmumu koki (algoritmi C4.5 un CART), diskriminantu analīze un daudzdimensiju logit regresija transportlīdzekļu veidu (mašīna, gājējs, sabiedriskais transports, taksometrs un riteņbraucējs) pārvietošanās analīzei. Lēmumu koku klasifikācijas rezultāti parādīja, ka 67% - 78% eksemplāru bija klasificēti pareizi. Papildus apstrādājot izejas datus, kombinējot vairākus filtrus, pareizi klasificēto eksemplāru skaits tika palielināts līdz 80% algoritmam C4.5 un līdz 92% algoritmam CART. Tiešā un soļu diskriminantu analīze parādīja nebūtisku atšķirību pareizi klasificēto eksemplāru skaitā. Soļu diskriminantu analīzes gadījumā pareizi tika identificēta piederība 64.1% novērojumu un 63.9% klasifikācijai ņemot vērā visus mainīgos vienlaicīgi. Klasifikācijas rezultātu ne sevišķi lielā precizitāte bija saistīta ar kategorijām "taksometrs" un "riteņbraucējs" atkarīgā mainīgā "transportlīdzekļu pārvietošanās veids". Samazinot kategoriju skaitu līdz trim (bez kategorijām "taksometri" un "riteņbraucējs") klasifikācijas precizitāte palielinājās līdz 79.6% soļu un tiešajai diskriminantu analīzei. Daudzdimensiju logistiskās regresijas klasifikācijas rezultāti uzrādīja, ka 88.6% respondentu tika klasificēti pareizi. Uzbūvētā modeļa lielā statistiskā nozīme liecina par to augsto kvalitāti un piemērotību uzdevuma risināšanai. Анализ транспортных средств передвижения с помощью классификационных методов Выбор вида перемещения (mode choice) среди дискретных задач выбора наиболее широко отражен в литературе. Выбор и прогнозирование вида передвижения тесно связаны с политикой транспортной системы, управлением спроса на поездки и стратегией уменьшения заторов на дорогах. В данной работе рассматриваются деревья решений (алгоритмы C4.5 и CART), дискриминантный анализ и множественная логит регрессия для анализа выбора средства передвижения (на машине, пешком, общественный транспорт, такси или на велосипеде). Результаты классификации с помощью деревьев решений показали 67% - 78% верно классифицированных экземпляров на тестируемом множестве. Дополнительно обработав исходные данные, комбинируя несколько фильтров, удалось повысить процент верно классифицируемых экземпляров до 80% для алгоритма C4.5 и до 92% для алгоритма CART. Сравнительные результаты прямого метода и пошагового дискриминантного анализа показали незначительную разницу верно классифицированных наблюдений. В случае пошагового дискриминантного анализа правильно определена принадлежность 64,1% наблюдений и 63,9% при классификации с учетом всех независимых переменных одновременно. Невысокая точность классификации связана с категориями такси и велосипед зависимой переменной тип перемещения. Уменьшение категорий с пяти до трех (без категорий такси и велосипед) увеличило точность классификации на 79,6% для пошагового дискриминантного анализа, и до 79,8% для классификации с учетом всех независимых переменных одновременно. Результаты множественной логистической регрессии показали, что 88,6% респондентов были классифицированы верно. Высокая статистическая значимость построенной модели, основанная на методе максимального правдоподобия (Sig. < 0,001), свидетельствует о ее высоком качестве и пригодности для решения поставленной задачи.