वन-वे, ओपन जॉज़, क्लोज्ड लूप्स, और अधिक: शिकागो में उबर की यात्रा का एक दिन

कुछ समय पहले, हमने Uber के डेटा में कुछ दिलचस्प देखा: बहुत सारी यात्राएँ अन्य यात्राओं से कनेक्ट नहीं होती हैं। दूसरे शब्दों में, एक सवार कहीं जाने के लिए उबेर का उपयोग करेगा, लेकिन वे उबेर के साथ अपने मूल में वापस नहीं आते (या आगे अपने गंतव्य के लिए जारी रखें)। इसने हमारा ध्यान आकर्षित किया क्योंकि इस तरह की यात्रा आमतौर पर एक व्यक्तिगत ऑटोमोबाइल के साथ संभव नहीं होती है: यदि आप अपनी कार को कहीं चलाते हैं, तो आपको लगभग हमेशा वापस ड्राइव करना पड़ता है।

हमें लंबे समय से यह संदेह है कि ये "एक-तरफ़ा यात्राएँ" मल्टीमॉडल यात्रा के भाग हैं - दूसरे शब्दों में, सवार अपनी आवश्यकताओं, कार्यक्रम और बजट के अनुरूप परिवहन के अन्य साधनों के साथ उबेर का संयोजन कर रहे हैं। उदाहरण के लिए, एक रेल कम्यूटर जो देर रात तक काम करता है, शायद उबर को घर ले जाने का विकल्प चुन सकता है जब रेलगाड़ियाँ कम चल रही हों, या हो सकता है कि कोई उबेर का उपयोग दोस्तों के साथ मिलने के लिए करे और फिर बाद में पार्क की सवारी करने के लिए बाइक से जाने की जाँच करे। हमने पहले से ही बहुत सारे साक्ष्य देखे हैं कि सवार अपनी उबेर यात्राओं को सार्वजनिक पारगमन के साथ जोड़ते हैं, और एक तरफ़ा यात्राएं एक और औसत दर्जे का दृश्य बहुपक्षीयता प्रदान कर सकती हैं।

यह निर्धारित करने के लिए कि यह कितनी बार होता है, हमने Uber के डेटा के माध्यम से स्वचालित रूप से झारने और एक तरफ़ा यात्राएं गिनने के लिए एक सरल एल्गोरिथम विकसित किया। यह पता चला है कि एक पर्याप्त संख्या वास्तव में इस पैटर्न को फिट करती है: अधिकांश अमेरिकी शहरों में 20-30% यात्राएं किसी भी छोर पर कोई स्पष्ट संबंध नहीं दिखाती हैं। नीचे दिए गए चित्र 5 वर्तमान अमेरिकी शहरों में एक तरफ़ा यात्रा प्रतिशत के साथ-साथ हमारे द्वारा उपयोग की जाने वाली परिभाषा को दर्शाते हैं:

एल्गोरिथ्म उबेर का योजनाबद्ध चित्रण एक तरफ़ा यात्राओं को खोजने के लिए उपयोग करता है। शिकागो में इस आरेख प्रारंभ और अंत बिंदु के लिए मनमाने ढंग से चुना गया था, और उनके बीच सबसे तेज़ मार्ग दिखाया गया है।

सीधे शब्दों में कहें, तो हम एक-तरफ़ा यात्रा को एक यात्रा के रूप में परिभाषित करते हैं जो एक ही उपयोगकर्ता की अन्य उबेर यात्राओं से अंतरिक्ष या समय में अलग-थलग है। हालाँकि, इस पद्धति में कुछ कमियां हैं। सबसे पहले, यह सुनिश्चित करने के लिए कि हम एक-तरफ़ा यात्राओं की संख्या को कम नहीं कर रहे हैं, हमने एल्गोरिथम को अत्यधिक चयनात्मक बना दिया है: उदाहरण के लिए, यह बाद की यात्रा के साथ किसी भी यात्रा की गणना नहीं करता है (भले ही वह आगे की यात्रा में वापस न आए। मूल प्रस्थान बिंदु)। दूसरा, और अधिक महत्वपूर्ण बात, यात्रा पैटर्न जटिल हैं; एक ही संख्या में बहुपत्नी व्यवहार को कम करने की कोशिश करके, हम लगभग निश्चित रूप से डेटा में कुछ समृद्ध अंतर्दृष्टि गायब कर रहे हैं।

अधिक विस्तृत चित्र के लिए, हम सबसे बुनियादी डेटा विज्ञान तकनीक पर वापस गए: वास्तव में कच्चे डेटा को देख रहे हैं। हमने फरवरी में एक सप्ताह के दौरान शिकागो में एक सवारी में बेतरतीब ढंग से 100 अनाम सवारियों को उठाया और एक ही दिन में यात्रा के प्रकारों को वर्गीकृत करने और गिनने की कोशिश की। उपयोगकर्ता की गोपनीयता की रक्षा करने के लिए, और हमारी गोपनीयता नीति के अनुरूप, न तो सवारों की पहचान और न ही उनकी विशिष्ट यात्रा की उत्पत्ति और गंतव्य दर्ज किए गए (सिवाय इसके कि जब कोई यात्रा मिडवे या ओ'हारे से गई थी, तो इस मामले में इसे "के रूप में गिना गया था" हवाई अड्डे की यात्रा ”)।

जैसा कि हमने डेटा को देखा, एक हड़ताली पैटर्न तेजी से उभरा: संभावित मानव यात्रा व्यवहार के ब्रह्मांड के बावजूद, उबेर यात्राओं का विशाल बहुमत पांच काफी सरल श्रेणियों में फिट होने के लिए लग रहा था। निम्नलिखित श्रेणियां हैं जिन्हें हमने पाया; ध्यान दें कि हमने केवल एक यात्रा को "कनेक्टिंग" के रूप में गिना है यदि 1/2 मील के भीतर पिक-ड्रॉपऑफ जोड़ी थी और 24 घंटे से कम समय का अंतर था:

  • एक तरीका: बिंदु A से बिंदु B तक यात्रा, लेकिन A से पीछे की कोई यात्रा नहीं है या B से आगे की यात्रा को कनेक्ट करना है।
  • राउंड ट्रिप: ए से बी तक ट्रिप, और बी बैक से ए तक एक और।
  • एंड-ऑन-एंड: ए से बी तक ट्रिप, और फिर बी से सी तक आगे (एक ही दिशा में)।
  • खुला जबड़ा: A से B तक ट्रिप, और दूसरा (लगभग उल्टी दिशा में) B से C तक, जहां A और C 1/2 मील से अधिक दूरी पर हैं। वैकल्पिक रूप से, ए से बी तक की यात्रा, उसके बाद सी से ए से दूसरे में (बी और सी के साथ 1/2 मील से अधिक)।
  • लूप: 3 या अधिक यात्राएं एक-दूसरे से जुड़ती हैं, जहां उपयोगकर्ता अपने शुरुआती बिंदु पर वापस समाप्त होता है।

अंत में, मुट्ठी भर यात्राएं या तो हवाई अड्डों से (तकनीकी रूप से एक-तरफ़ा यात्राएं, लेकिन एक बहुपक्षीय दृष्टिकोण से कम दिलचस्प) या इनमें से किसी भी वर्गीकरण में फिट नहीं लगती हैं। इन यात्रा प्रकारों के आरेख और प्रत्येक श्रेणी में प्रतिशत, नीचे दिए गए चित्र में दिखाए गए हैं।

शिकागो में 100 राइडर-दिनों के डेटा के दृश्य निरीक्षण से उभरी उबेर यात्रा के प्रकारों की वर्गीकरण के साथ-साथ प्रत्येक श्रेणी में आने वाली यात्राओं का प्रतिशत।

मैन्युअल रूप से गिने जाने वाली एक तरफ़ा यात्राओं की संख्या (34%) उसी महीने स्वचालित रूप से मापी गई संख्या (26%) से कुछ अधिक है। इस अंतर में से कुछ की संभावना है क्योंकि स्वचालित विधि किसी भी यात्रा को अनदेखा करती है जो दूसरे से जुड़ती है - इसलिए यदि कोई उबेर को काम करने के लिए अपने घर से वापस ले जाता है, तो उसी दिन घर से एक रेस्तरां में एक-तरफ़ा यात्रा करता है, यह अंतिम यात्रा एक तरफ़ा के रूप में नहीं गिना जाएगा क्योंकि एल्गोरिथ्म इसे पिछली यात्रा से एक कनेक्शन के रूप में देखता है। इन मतभेदों को एक तरफ, इस अभ्यास ने विभिन्न जटिल यात्रा प्रकारों (जैसे एंड-ऑन-एंड और ओपन-जबड़े ट्रिप) का पता चला, जिन्हें अंतराल में भरने के लिए परिवहन के अन्य रूपों की आवश्यकता होती है, और इसलिए मल्टीमॉडल यात्रा का संकेत भी दे सकते हैं। उबेर यात्राओं के "हवाई अड्डे और अन्य" श्रेणी को छोड़कर, आधे से अधिक (56%) अन्य परिवहन मोड के साथ उबेर के संयोजन को प्रतिबिंबित करने के लिए दिखाई देते हैं - लगभग दो बार जितनी संख्या में हम एल्गोरिदम को मापते हैं।

अब, कुछ महत्वपूर्ण चेतावनी: यहाँ की वर्गीकरण कुछ व्यक्तिपरक है, और इन यात्राओं को देखने वाला एक अलग व्यक्ति इस बात से असहमत होगा कि कुछ यात्राओं को कैसे वर्गीकृत किया जाना चाहिए। उबेर सवारों की अरबों यात्राओं की तुलना में नमूना आकार भी छोटा है, इसलिए यह एल्गोरिथम माप की तुलना में विचरण के अधिक विषय है। और जब मल्टीमॉडल व्यवहार के बारे में निष्कर्ष निकालते हैं, तो यह ध्यान रखना महत्वपूर्ण है कि हम वास्तव में यह नहीं जानते कि उपयोगकर्ता क्या कर रहे हैं जब वे उबर नहीं ले रहे हैं: यह पूरी तरह से संभव है कि इनमें से कुछ "वन-वे ट्रिप" सवार सवार टैक्सी का इस्तेमाल करते हैं, Lyft, या दूसरे पैर के लिए एक दोस्त से एक सवारी। इसके विपरीत, एक मेटा-स्टेशन से जुड़ने वाली एक राउंड-ट्रिप उबर की सवारी वास्तव में एक मल्टीमॉडल यात्रा का हिस्सा होगी, लेकिन इसे उपरोक्त वर्गीकरण में नहीं गिना जाएगा।

चाहे स्वचालित रूप से या मैन्युअल रूप से मापा गया हो, हमारा डेटा बताता है कि उबेर स्वयं निजी कार स्वामित्व के लिए स्थानापन्न नहीं करता है - यदि ऐसा होता है, तो हमारे उपयोगकर्ताओं की बहुत अधिक यात्राएं राउंडट्रिप या लूप होंगी। लेकिन चलने योग्य, बिकने योग्य पड़ोस और स्वस्थ सार्वजनिक पारगमन बुनियादी ढांचे के साथ शहरी वातावरण में, साझा गतिशीलता की वृद्धि निवासियों को घर पर अपनी कारों को छोड़ने (या पूरी तरह से कार स्वामित्व देने) में सक्षम कर सकती है और परिवहन विकल्पों का चयन कर सकती है जो किसी भी समय उनकी आवश्यकताओं को फिट करते हैं दिन या रात।