जहां हमारी टीम पहले नहीं गई है

जब आप वहां नहीं जा रहे हैं, तो यह कैसे पता करें कि आप वहां कैसे जा रहे हैं।

डेटा साइंस टीम के अनुसंधान की दिशा को व्यवस्थित करना अपने आप में एक चुनौती है और कोई एल्गोरिथ्म नहीं है जिसके साथ इसे अनुकूलित किया जा सके। इस तिमाही हमारी टीम कुछ नया करने की कोशिश कर रही है।

आम तौर पर जब हमारी डेटा साइंस टीम किसी उत्पाद के लिए संभावित समाधानों के लिए शोध करती है, जिसे हम सभी दिशाओं में बिखेरते हैं और कुछ कागजात और / या दृष्टिकोण वापस लाते हैं। फिर उच्च स्तर पर इन पर चर्चा की जाती है। हम कुछ चीजों को आज़माने के लिए फिर से बिखरते हैं। हम विविध पृष्ठभूमि से आते हैं और अनुभव के अलग-अलग स्तर हैं। इसके बजाय आकस्मिक तदर्थ दृष्टिकोण में कुछ कमियां हैं।

हमारी जानकारी और हमारी विशेषज्ञता मूर्ख बन जाती है। जब प्रत्येक वैज्ञानिक अपने दम पर दिशाओं का पीछा कर रहा है या अकेले शोध पत्रों के माध्यम से काम कर रहा है, तो वे बौद्धिक और विकासात्मक सहयोग से अलग हो जाते हैं। उनके साथियों को पृष्ठभूमि ज्ञान नहीं हो सकता है जो प्रभावी रूप से सहयोग करने में सक्षम हों और उन्होंने इस समस्या के बारे में इतनी मजबूत अंतर्ज्ञान विकसित किया हो कि वे अपने साथियों को साथ लाने के लिए संघर्ष करते हैं।

दूसरा दोष संबंधित है लेकिन शायद इससे भी अधिक महत्वपूर्ण है। यह प्रतिमान एक टीम के लिए "विशेषज्ञों" को विकसित करने के लिए पूरी टीम को तैयार करने की कीमत पर बहुत आसान बनाता है। एक व्यक्ति एक कठिन चुनौती के माध्यम से काम कर सकता है, लेकिन यह टीम को पूरे सुधार के रूप में मदद नहीं करता है। हम टीमों में काम करने का एक बहुत कारण है क्योंकि यह हमें खुद को और हमारी टीम के साथियों को विकसित करने की अनुमति देता है। हालांकि यह संभव नहीं है, हालांकि, यह संभावना नहीं है कि एक व्यक्ति अकेले एक गहरी समझ हासिल करेगा, यह पूरी टीम के लिए उस समझ को प्राप्त करने के लिए कहीं अधिक मूल्यवान है।

नए दृष्टिकोण की कोशिश करने के लिए सबसे महत्वपूर्ण कारण एक आम नींव का निर्माण है। यह टीम के प्रत्येक सदस्य के लिए हर पेपर को पढ़ने या हर संभावित अनुसंधान दिशा पर एक विशेषज्ञ बनने के लिए संभव नहीं है। हालाँकि, पूरी टीम के लिए यह संभव है कि वह अंतर्निहित समस्या की एक सामान्य मूलभूत समझ विकसित करे जिससे वह कूद सके। यह सामान्य आधार ज्ञान की सिलोइंग को कम करने में मदद करता है और "पहाड़ पर बुद्धिमान" सिंड्रोम को कम करने में मदद करता है जो एक टीम में "विशेषज्ञ" हो सकते हैं।

तदर्थ दृष्टिकोण का पहला विकल्प जो हमने आजमाया, वह था "उच्च पर निर्देश" या ऊपर-नीचे की विधि। यह वह जगह है जहां एक अधिक वरिष्ठ वैज्ञानिक आकलन करता है-कुछ संभावनाओं में से, कुछ विचारों को एक विकास योजना के बिंदु पर विकसित करता है और फिर उन्हें क्रियान्वित करने के लिए टीम के साथियों को भेज देता है। यह कोड लिखित होने में सैद्धांतिक रूप से समय कुशल है और पारंपरिक प्रबंधन ढांचे में अच्छी तरह से फिट बैठता है, लेकिन केवल पहले चर्चा की गई खामियों को बढ़ाता है। जिन वैज्ञानिकों को तानाशाही की जा रही है, वे निराश महसूस करेंगे कि वे बिना समझे मॉडल का निर्माण कर रहे हैं और कार्य के लिए उनमें थोड़ा उत्साह होगा। यह परिदृश्य एक कम उत्पादक टीम, खराब विकसित मॉडल और नवाचार की एक कड़ी के साथ समाप्त होता है।

इस तिमाही में हम जिस विकल्प की कोशिश कर रहे हैं वह एक शीर्ष-विधि है। इस पद्धति में एक वरिष्ठ सदस्य अनुसंधान योजना स्थापित करने के लिए जिम्मेदार होता है, लेकिन यह तय करने के बजाय कि वे टीम के साथ मिलकर काम करते हैं। एक बार सामान्य लक्ष्य तय हो जाने के बाद, ऑल-टीम मीटिंग की एक श्रृंखला निर्धारित की जाती है। इन बैठकों के माध्यम से पूरी टीम समस्या के स्थान और अनुसंधान की वर्तमान स्थिति की एक ठोस मूलभूत समझ का निर्माण करती है। टीम विभिन्न दृष्टिकोणों पर चर्चा करती है और अपने विचारों को कुछ व्यवहार्य योजनाओं में बदल देती है। निम्नलिखित अनुभाग बैठकों और प्रक्रियाओं का विस्तार करेंगे।

बैठक की तैयारी

पूरी टीम को एक कमरे में बुलाने से पहले, सुविधाकर्ता को यह सुनिश्चित करने के लिए कुछ तैयारी करने की ज़रूरत है कि चीजें केंद्रित रहें और एक लक्ष्य की ओर बढ़ें। यह महत्वपूर्ण है कि सटीक लक्ष्य को उत्पाद प्रबंधन के साथ परिभाषित और सहमति दी गई है। एक उदाहरण के रूप में हमारा लक्ष्य कथन है:

हमें सभी भाषाओं के लिए एक एकल मॉडल समापन बिंदु चाहिए। इसका मतलब यह है कि हमें एक अनियंत्रित भाषा से पाठ के एम्बेडिंग के लिए एक बिंदु को क्वेरी करने में सक्षम होना चाहिए। इस बिंदु को विलंबता और मॉडल गुणवत्ता दोनों में प्रदर्शन करने की आवश्यकता है। वर्तमान में उपयोग किए जाने वाले प्रति भाषा दृष्टिकोण की तुलना में नए दृष्टिकोण में विलंबता और MRR (मतलब पारस्परिक रैंक) में कोई कम प्रदर्शन नहीं होना चाहिए। नए दृष्टिकोण को कम से कम वर्तमान में समर्थित भाषाओं के सेट का समर्थन करना चाहिए।

हमारे लक्ष्य के बारे में ध्यान देने योग्य बातें हैं। यह स्पष्ट रूप से बताता है कि अंतिम परिणाम के रूप में क्या आवश्यक है, एक एकल बिंदु जो एक मनमाना भाषा के पाठ के लिए एक एम्बेडिंग देता है। यह नहीं कहता है कि कैसे होना चाहिए या किस प्रकार के मॉडलिंग दृष्टिकोण का उपयोग किया जाना चाहिए। अंत में यह हमें एक न्यूनतम प्रदर्शन बार प्रदान करता है, हमें कम से कम और साथ ही उन भाषाओं के लिए भी काम करना चाहिए जो अभी हम समर्थन कर रहे हैं।

यह महत्वपूर्ण है कि चरण 1 किकऑफ बैठक के दौरान क्या हो रहा है, इसके बारे में पूरी टीम को पता है क्योंकि उन्हें विचारों को सोचने और उत्पन्न करने के लिए समय की आवश्यकता होगी।

किकऑफ़ मीटिंग: सामान्य परिभाषाएँ

यह पहली मुलाकात दोनों में से छोटी है लेकिन किसी भी तरह से कम नहीं है। हमने 3 घंटे निर्धारित किए और इसका अधिकांश उपयोग किया। समस्या और आवश्यकताओं की एक आम समझ स्थापित करने के लिए इस बैठक का लक्ष्य। स्थापित करने के लिए एन चीजें हैं, जहां एन N4:

अभी हम क्या कर रहे हैं?

वर्तमान दृष्टिकोण (यदि कोई हो) पर चर्चा करें और लिखें। "हम अभी इससे निपट नहीं रहे हैं" पूरी तरह से मान्य उत्तर है।

वर्तमान दृष्टिकोण टिकाऊ क्यों नहीं है?

आप इस शोध को कारण बता रहे हैं। यह क्या है? वर्तमान समाधान आपको नीचे कैसे दे रहा है या यह कैसे स्केलेबल नहीं है? यदि आपके पास वर्तमान तरीका नहीं है तो निश्चित रूप से यह आपके लिए काम नहीं कर रहा है।

हमें क्या चाहिए / चाहिए?

आप नया दृष्टिकोण क्या करना चाहते हैं? अत्यधिक महत्वाकांक्षी से शुरू करें "सभी चीजें करें!" और उचित सरलीकरण के माध्यम से अपना रास्ता नीचे तक काम करें जब तक कि आप न्यूनतम व्यवहार्य मॉडल तक नहीं पहुंचें जो लक्ष्य और मुद्दे को वर्तमान दृष्टिकोण के साथ संबोधित करेंगे।

अब हम किन विचारों के साथ आ सकते हैं?

साहित्य क्या कहता है और क्या किया गया है, इस बारे में चिंता किए बिना विचारों को उत्पन्न करने का यह आपका मौका है। हो सकता है कि यह विचार हास्यास्पद है और यह कभी संभव नहीं होगा लेकिन इसे कभी भी लिख लें। इस अभ्यास का लक्ष्य टीम के लिए अपनी कल्पनाओं का उपयोग करना, बाहर निकालना और कुछ नई दिशाओं में सोचना है। एक बार लुढ़क जाने के बाद आपको कितना आश्चर्य होगा। यह वास्तव में महत्वपूर्ण है कि सभी टीम के सदस्य मूल्यवान प्रतिभागियों की तरह महसूस करें। केवल उन विचारों को न देखें जो उन्हें तलाशते हैं। विस्तार और परिवर्तन के लिए पूछें।

डेटा और मैट्रिक्स के बारे में क्या?

यह देखते हुए कि हमने पहले तीन वस्तुओं के बारे में क्या कहा है, हमें किस तरह के डेटा की आवश्यकता है और हमें किस प्रकार का डेटा मिल सकता है? जितना संभव हो उतना स्पष्ट रूप से पहचानें कि सार्वजनिक और / या निजी डेटासेट आप तक पहुँच प्राप्त कर सकते हैं और उन्हें उपभोग्य बनाने के लिए क्या करने की आवश्यकता है। इस बिंदु पर आप उन मेट्रिक्स को भी परिभाषित करते हैं जो आपकी रुचि के हैं और आप यह निर्धारित करेंगे कि "सफलता" कैसी दिखती है। यह बैठक को निर्देशित करने के लिए उपयोग किए गए लक्ष्य विवरण को प्रतिबिंबित करना चाहिए।

हम कल क्या सीखने वाले हैं?

एक बार पहले तीन आइटम तलाशने के बाद, टीम को कुछ वर्तमान शोध पत्रों को खोजकर और चुनकर कला की वर्तमान स्थिति की खोज करने के लिए अपना ध्यान केंद्रित करना चाहिए जो क्षेत्र में ज्ञान की नींव बनाने में उपयोगी होते हैं। इन पेपर उम्मीदवारों को किसी भी टीम के सदस्य द्वारा प्रस्तावित किया जा सकता है लेकिन अधिमानतः वे यह निर्धारित करने के लिए पर्याप्त से अधिक नहीं पढ़े हैं कि क्या यह प्रासंगिक है।

3 या चार सबसे अधिक प्रासंगिक / उपयोगी का चयन करने के लिए, एक टीम के रूप में प्रत्येक पेपर का मूल्यांकन करें, ज़ोर से पढ़ने वाले सार को पढ़े। महत्वपूर्ण: बैठकों से पहले टीम में कोई भी नहीं जाना चाहिए और कागजात पढ़ना चाहिए। यह बहुत महत्वपूर्ण है क्योंकि अगले चरण सबसे अच्छा काम करता है अगर हर कोई कागजों के संबंध में एक ही पायदान पर हो।

और कुछ?

क्या कोई अन्य चिंताओं या विचारों पर चर्चा की जानी है। चीजों को लाने के लिए पूरी टीम के लिए मंजिल खुली होनी चाहिए।

रिसर्च किकऑफ: बिल्डिंग द फाउंडेशन

यह बैठक इस बात से अधिक है कि आप एक सम्मेलन कक्ष को पूरे दिन के लिए व्हाइटबोर्ड से बुक करते हैं और टीम उस दिन को ज्ञान की नींव बनाने पर ध्यान केंद्रित करने के लिए खर्च करती है।

इस बैठक का मूल आधार यह है कि प्रत्येक व्यक्ति को पढ़े गए प्रत्येक पेपर के प्रत्येक खंड की अपनी समझ पर विश्वास होना चाहिए या सभी लोगों को इस बात पर एकमत होना चाहिए कि वे इसका अर्थ नहीं समझ सकते। यदि कोई व्यक्ति किसी खंड की अपनी समझ में विश्वास नहीं करता है, तो हम उसे अतीत में स्थानांतरित नहीं करेंगे। अगर इसका मतलब है कि पूरा समय एक ही लेख पर खर्च किया जाता है, तो यह उसी तरह होगा।

चरण 1: सबसे उपयोगी / प्रासंगिक लेख जैसा दिखता है उसे चुनें

चरण 2: एक टीम सदस्य सार के साथ शुरू होने वाले पैराग्राफ को पढ़ता है।

चरण 3: समझ को समझने के लिए जाँच करें।

  • यदि कोई अनिश्चित है, तो रुकें और यदि आवश्यक हो तो Google का उपयोग करें या तब तक चर्चा करें जब तक कि सभी की समान समझ न हो।
  • यह पैरा में किसी भी गणितीय या तकनीकी सामग्री को पढ़ाने या पुन: उपयोग करने के लिए पाठक के लिए एक अच्छा विचार है। इससे टीम को पता चलता है कि क्या वे सभी चीजों को उसी तरह समझ रहे हैं।

चरण 4: अगली टीम का सदस्य एक पैराग्राफ पढ़ता है

स्टेप 3 से पेपर पूरा होने तक दोहराएं

अंतिम चरण: कागज के takeaways पर चर्चा करें और निर्धारित करें कि क्या दृष्टिकोण संभव है। छोटे, मध्यम, बड़े पैमाने पर इस तरह के मॉडल को लागू करने की कठिनाई को दर करने में मददगार है। यदि आवश्यक हो, तो किसी भी आवश्यक कागजात को पढ़ने के लिए एक 3 वीं बैठक बुक करें।

जाँच करना

मीटिंग फैसिलिटेटर / सीनियर साइंटिस्ट को 2-3 मीटिंग्स के नतीजे लेने चाहिए और उन्हें एक्शन के सेट में डिस्टिल करना चाहिए। इन क्रियाओं को समय के क्रम में व्यवस्थित किया जा सकता है जिसे बाद में तिमाही में योजनाबद्ध किया जा सकता है। कुछ भी याद नहीं किया गया है और कार्यों को आवंटित करने के लिए टीम के सदस्यों के साथ वापस जांचें। याद रखें, हमेशा अच्छा डेटा बनाने के साथ शुरू करें।

रेट्रो: रिफ्लेक्टिंग ऑन द गुड, द बैड एंड द अग्ली

किसी भी नए उपक्रम का एक महत्वपूर्ण हिस्सा बाद में विराम दे रहा है और यह दर्शाता है कि प्रक्रिया कैसे सफल हुई, कहां असफल हुई और क्या थोड़ा पॉलिश की जरूरत है; हमने तिमाही के अंत में इनमें से एक रेट्रोस्पेक्टिव का संचालन किया।

रेट्रो का आयोजन

यह एक बड़े व्हाइटबोर्ड के साथ या सिर्फ पोस्ट-इट नोट्स पर किया जा सकता है। क्या प्रत्येक टीम का सदस्य प्रत्येक श्रेणी के लिए कम से कम एक बात लिखता है।

  • द गुड: क्या विशेष रूप से अच्छी तरह से चला गया। एक व्यक्ति के रूप में और टीम के लिए नई प्रक्रिया का आपके लिए सबसे बड़ा सकारात्मक प्रभाव कहां पड़ा।
  • बुरा: नई प्रक्रिया कहाँ विफल रही। क्या अवरोधक या ठोकरें खाते हुए आप और / या टीम मुठभेड़ हो सकती है, जो पूर्वाभास कर सकती थी। आपके लिए क्या उपयोगी नहीं था
  • द बदली: हमने क्या किया जो काफी अच्छा नहीं था। क्या कुछ छूट गया था या पूरी तरह से समझाया / समझा नहीं गया था।

श्रेणियों के माध्यम से ले जाएँ, बुरा -> बदसूरत -> अच्छा है, और प्रत्येक बिंदु पढ़ें। इस प्रक्रिया के दौरान कोई दोष और कोई शर्म नहीं है। यह सहयोग और टीम अनुसंधान क्षमताओं में सुधार करने की इच्छा से वसंत चाहिए। यदि लेखक को विस्तृत रूप से बताना चाहिए। प्रत्येक के लिए, यह निर्धारित करें कि क्या कोई ऐसी कार्रवाई है जो इसे सुधारने के लिए की जा सकती है या होनी चाहिए, इसे नीचे लिखें और इसे एक मालिक दें।

हमारा रेट्रो

हमारा रेट्रो अविश्वसनीय रूप से उपयोगी था और मैं आपके साथ जो कुछ भी सीखा था, उसे साझा करूंगा। यदि उचित हो तो इन्हें आपकी प्रक्रिया में शामिल किया जाना चाहिए

खराब

हमारे अधिकांश "खराब" अंक "पर्याप्त तकनीकी प्रस्तुत नहीं" के शीर्षक के तहत गिर गए। विशेष रूप से, हमने महसूस किया कि हमें नट और बोल्ट को कवर करने के लिए एक 3 की बैठक जोड़ने की आवश्यकता है कि हम कैसे आगे बढ़ने वाले थे। इसमें इस तरह की चीजें शामिल थीं

  • डेटा संगठन: सभी ETL सामान
  • टाइमलाइनिंग: सभी ग्राउंडवर्क के काम करने से पहले हम प्रयोगों में चले गए। हम कैसे परीक्षण करने जा रहे थे, हमारी आधार रेखा क्या थी जैसी चीजें। हमें अपना कुछ डेटा कहां मिल रहा था।
  • हम अपने प्रयोगों को कैसे संभालेंगे और व्यवस्थित करेंगे। फ़ाइलों को कॉन्फ़िगर करें? लिखना और परिणाम साझा करना।

इस श्रेणी का सारांश था, हमने महान अनुसंधान विचार उत्पन्न किए लेकिन निष्पादन पर अधिक ध्यान देने और विचार करने पर नीचे गिर गए।

बदसूरत

हमारे बुरे बिंदुओं से बहुत कुछ बदसूरत हो गया। हमें बहुत अच्छे शोध मिले लेकिन उचित आंतरिक और बाहरी डेटा को भी ट्रैक करना चाहिए था। बिंदुओं के अन्य बड़े समूह हमारे पर्यावरण सेटअप के आसपास थे। हमारी सुरक्षा सख्तियों के भीतर काम करने वाले उपयुक्त पुस्तकालयों को प्राप्त करने की कोशिश करना, python3 में अपग्रेड करना और मौजूदा कोड में बदलते संस्करणों के साथ आए सभी छोटे बगों को ठीक करना। ये सभी चीजें केवल आंतरिक समस्याएं थीं और अन्य संगठनों में मौजूद नहीं हो सकती हैं।

अच्छा

अच्छी श्रेणी अब तक की सबसे बड़ी थी और हमें गर्व और संतुष्टि की भावना से भर देती थी। हमने प्रत्येक सदस्य के साथ अविश्वसनीय टीमवर्क का प्रदर्शन किया और दूसरों को कौशल प्रदान किया। टीम पेपर रीडिंग ने सभी को इस बात की पक्की समझ प्रदान की कि हम क्या काम कर रहे हैं और नए विचारों के निर्माण के लिए एक साझा संदर्भ। अन्य अच्छे बिंदु थे:

  • हम जल्दी से विचारों के माध्यम से पुनरावृति करने में सक्षम थे
  • हमने अपने लक्ष्य की दिशा में ठोस प्रगति की है
  • हम सभी ने विचारों पर शोध के प्रयोगों में सुधार किया, जो हमारी जिज्ञासा को संतुष्ट करने के बजाय हमें भौतिक तरीके से आगे बढ़ाएंगे।

निष्कर्ष

पिछली तिमाही में हमारा प्रतिबिंब और इस प्रक्रिया ने इसे ज्ञान के साइलोइंग का मुकाबला करने और टीम के भीतर अकेले ’विशेषज्ञों के निर्माण को रोकने में अविश्वसनीय रूप से उपयोगी दिखाया है। हम अपनी प्रक्रिया के अगले पुनरावृत्ति में सभी हाथों पर व्यावहारिकताओं को निर्धारित करने के लिए एक तीसरी बैठक जोड़ेंगे और यह हमारे रेट्रो में उठाए गए मुद्दों को उम्मीद से संबोधित करेगा। हमारी प्रक्रिया को साझा करने में हमारी आशा है कि आप इसे अपनी टीम और कंपनी के लिए अनुकूल बनाने में सक्षम होंगे और अपनी खुद की चुनौतियों के लिए उपन्यास और दिलचस्प दृष्टिकोण विकसित करने में सफल होंगे।