स्थानिक पैटर्न विश्लेषण

डेटा संवर्धन मायने रखता है। व्यवसाय और शिक्षा सहयोग

पहली बार मानचित्र में स्थान डेटा जोड़ते समय हम क्या देखने की उम्मीद करते हैं? मुझे पूरा यकीन है कि हमारा लक्ष्य यह पता लगाना है कि क्या कोई स्थानिक पैटर्न है: उच्चतर और निम्न तीव्रता वाले क्षेत्र, सुविधाएँ, क्लस्टर और आउटलेर, सामान्य दिशाएँ, अनियमित प्रक्षेप पथ, उच्च या निम्न मान वाले क्षेत्र, आदि जैसे ही। पैटर्न का पता लगाने के लिए हम सुविधाओं के महत्व को निर्धारित करने के लिए तैयार हैं, पूर्वानुमान मॉडल का निर्माण करते हैं और खुद को डेटा वैज्ञानिक कहते हैं।

पैटर्न खोजने के लिए उपयोग किए जाने वाले दृष्टिकोण एक अलग लेख के लायक हैं। वर्तमान में, मैं इस पर काम कर रहा हूं और इसे "हीटमैप का उपयोग करना बंद करूं" शीर्षक से शुरू करने जा रहा हूं। तो चलिए कल्पना करते हैं कि शोधकर्ता पैटर्न विश्लेषण एल्गोरिदम से अवगत है, और जीआईएस की दुनिया में गहराई से जाने के लिए तैयार है।

इस अनुच्छेद में, मैं बिंदु पैटर्न विश्लेषण का उल्लेख करूंगा, पैटर्न विश्लेषण एल्गोरिदम के परिणाम दिखाएगा और गैर-जीआईएस पेशेवर का सामना करेगा और वर्तमान सॉफ्टवेयर अक्षमता के लिए समाधान विकसित करने में व्यापार और विज्ञान के बीच सहयोग का वर्णन करेगा।

बिंदु पैटर्न विश्लेषण। तीव्रता क्लस्टर और आउटलेयर

आइए एक सरल, लेकिन वास्तविक दुनिया के मामले से शुरू करते हैं: शोधकर्ता को एक शहर (पार्क) में चोरी (कार दुर्घटना, आपातकालीन कॉल, ट्वीट, फोटो, पक्षियों के घोंसले या बीवर के आवास) के स्थान मिले हैं। , समुद्र, देश ... कोई फर्क नहीं पड़ता)। शोधकर्ता का काम यह पता लगाना है कि क्या कोई स्थानिक पैटर्न है और यदि वे हैं तो उन्हें अलग करना है। उन्होंने यादृच्छिकता से बचने के लिए विशिष्ट सेल आकार का उपयोग करके वितरण के क्षेत्र में ग्रिड का निर्माण किया है। अगले चरण में, शोधकर्ता ने प्रत्येक सेल के अंदर कई विशेषताओं को गिना है और अंत में क्लस्टर्स एंड आउटलेयर एनालिसिस और / या हॉटस्पॉट्स एंड कोलडस्पॉट्स एनालिसिस चलाते हैं, यह वास्तविक कार्य पर निर्भर करता है।

इसके अलावा, उसने एनएनए और क्वाड्रैट एनालिसिस चलाया है, इसलिए शोधकर्ता को बहुत यकीन है कि अब वस्तुओं का वितरण बंद हो गया है और परिणाम इन समूहों, साथ ही साथ आउटलेर्स को दिखाते हैं।

चोरी पैटर्न विश्लेषण। एस्पेक्टम से स्क्रीनशॉट

मैं कहूंगा कि शोधकर्ता परिणाम से बहुत संतुष्ट है। आउटलेर की खोज शुरू करना काफी अच्छा है, हालांकि, उच्च और निम्न मूल्यों के समूहों द्वारा कवर किया गया क्षेत्र बहुत बड़ा है। शहर को जानने वाले लोगों के लिए, उच्च मूल्य क्लस्टर स्पष्ट दिखता है - ये आवासीय और व्यावसायिक क्षेत्र हैं। निम्न मान (नीला भाग) वाला क्लस्टर वनों, नदी और औद्योगिक क्षेत्रों से मेल खाता है।

संकुल क्षेत्रों के लिए अधिक सटीक परिणाम प्राप्त करने के लिए इस बिंदु पर शोधकर्ता डेटा का विश्लेषण करते हुए शहरी वर्गों को ध्यान में रखते हैं। यह समान क्षेत्रों के भीतर समूहों को खोजने में मदद कर सकता है: हरे या पानी के क्षेत्रों से अलग आवासीय क्षेत्रों के भीतर सुविधाओं के वितरण की तुलना करना।

इसलिए, कल्पना करें कि शोधकर्ता ने एस्पेक्टम का उपयोग नहीं किया और जीआईएस से संबंधित सभी मुद्दों का सामना किया: शेपफाइल्स, अनुमानों, अनाड़ी डेस्कटॉप सॉफ्टवेयर, वितरण वेक्टर डेटा के क्षेत्रों, ग्रिड आकार सूत्र, प्लगइन्स के माध्यम से उपयुक्त एल्गोरिदम या अलग-अलग एक्सटेंशन (btw) के मामले में एस्पेक्टम का उपयोग करना केवल कच्चे डेटा के बारे में है)।

अब उसे शहरी भूमि वर्गीकरण वेक्टर डाटासेट का निर्माण करना होगा। पर कैसे? डेटा कहां मिलेगा? किन क्षेत्रों को प्रतिष्ठित किया जाना चाहिए? इस क्षेत्र को वर्गीकृत करने के लिए कौन से पैरामीटर हैं? आगे के कार्यों के लिए इसे स्वचालित कैसे करें?

परियोजना। जब व्यापार और शिक्षा समृद्ध होती है

हमारा मानना ​​है कि यह सॉफ्टवेयर विकास कंपनियों का काम है कि वे एक मूल्यवान परिणाम देने में सक्षम उत्पाद का उत्पादन करें ताकि लक्षित दर्शकों को काम करने के लिए सिखाने की आवश्यकता न हो। और जीआईएस के मामले में, यह आम तौर पर हाई स्कूल की पढ़ाई के 6 साल लगते हैं।

एस्पेक्टम ने दुनिया की सभी बस्तियों के लिए शहरी लैंडयूज़ डेटा बनाने के लिए एक परियोजना शुरू करने का फैसला किया। ऐसा महत्वाकांक्षी लक्ष्य रिव्ने नूस्फीयर इंजीनियरिंग स्कूल के हमारे दोस्तों और भागीदारों के लिए दिलचस्प हो गया। सॉफ्टवेयर इंजीनियरिंग, जीआईएस, शहरी अध्ययन पृष्ठभूमि वाले छात्रों की टीम और सबसे पहले, व्याख्याताओं की देखरेख में जुनून का आयोजन किया गया था।

चूंकि कार्य के लिए कोई सही दृष्टिकोण नहीं है, हमने पुनरावृत्तियों द्वारा विकसित करना शुरू किया, परिणामों की लगातार समीक्षा और चर्चा की। यह लेख परियोजना के कार्यान्वयन के मूल विचार को पेश करेगा, और परीक्षण के लिए अब उपलब्ध परिणामों को दिखाएगा।

निम्नलिखित लेखों में, हम साझा करेंगे दृष्टिकोणों का परीक्षण किया गया है, परिणाम जो काम नहीं किए, सुधार और पूरक सुविधाओं के लिए विचारों को लागू किया गया।

संकल्पना

भू-स्थानिक डेटा के साथ काम करने वाले विशाल ओपन सोर्स प्रोजेक्ट हैं। हमारा लक्ष्य दुनिया भर की बस्तियों में निश्चित क्षेत्र के बारे में सबसे सटीक और पूरी जानकारी प्राप्त करने के लिए डेटा और इसे संसाधित करने के तरीकों का विलय करना है। बस स्पष्ट करने के लिए - हम लैंडयूज़ प्रकारों के साथ काम नहीं कर रहे हैं, यह इन क्षेत्रों में होने वाली घटनाओं और प्रक्रियाओं पर प्रभाव की समानता के विचार के बारे में है। इसलिए पूरे शहर में आवासीय क्षेत्र बिल्कुल अलग हो सकते हैं, हमें उन्हें अलग-अलग वर्गों को सौंपना होगा। दूसरी ओर, हम ज़ोनिंग दृष्टिकोण के साथ काम नहीं कर रहे हैं - खुदरा और व्यावसायिक क्षेत्रों को एक समूह में संयोजित करने की आवश्यकता नहीं है, साथ ही यह स्पष्ट नहीं है कि यह प्रभावित करने के संदर्भ में शिक्षा और चिकित्सा क्षेत्रों को अलग करने के लिए बहुत मायने रखता है इन क्षेत्रों में स्थानिक पैटर्न पर।

वर्तमान परिणाम

अब हम उत्पाद के एमवीपी संस्करण का परीक्षण कर रहे हैं, डेटा वितरण के एक क्षेत्र के अंदर 4 वर्गों के बारे में जानकारी दे रहे हैं। एस्पेक्टम पर जाएं, अपना डेटा जोड़ें और शहरी भूमि वर्गीकरण विश्लेषण चलाएं। प्रक्रिया में थोड़ा समय लग सकता है और हमें अभी भी कई सीमाएँ मिली हैं, लेकिन हम एल्गोरिथ्म में लगातार सुधार कर रहे हैं।

स्थानीय और क्षेत्रीय स्तर पर कक्षाओं के साथ मानचित्र की जाँच करें

स्थानीय और क्षेत्रीय स्तरों में कक्षाएं। एस्पेक्टम से स्क्रीनशॉट

कार्य के दौरान कई विकास किए गए हैं, और हम उन्हें साझा करके खुश हैं। हमारे GitHub पृष्ठ पर एक नज़र डालें, हम लगातार परियोजनाओं को अपडेट और जोड़ रहे हैं। osm2geojson, हमारा नवीनतम अपडेट, OpenStreetMap डेटा को संसाधित करने के लिए एक शुद्ध पायथन समाधान है। अगले लेखों को याद न करने के लिए एस्पेक्टम का पालन करें।