अनुकूलन पर एक विचार: अल्फा शिकारी ™ समस्या

द्वारा: ब्लॉकफोर्स कैपिटल रिसर्च

हमारी पिछली पोस्ट [APM I] में, हमने व्यवस्थित डिजिटल एसेट ट्रेडिंग के लिए अल्फा प्रिडेटर ™ मॉडल (APM) का अनावरण किया; अल्फा और आउटपरफॉर्म बाजारों पर कब्जा करने के लिए जटिलता और लचीलेपन पर पूंजीकरण। हालाँकि, अल्फ़ा प्रिडेटर एक बहु-आयामी फैंटमैगोरिक शिकारी होने के बावजूद, यह एक उदार प्राणी है जो अपने अल्कोहल के प्रसार को छोड़ देता है, जिससे इसके अल्कोहल में सुधार हुआ बाजार पारिस्थितिक तंत्र के उपजाऊ अवशेषों में फैल जाता है। सभी प्रकार के निवेशकों के लिए ब्लॉकचेन सेक्टर को विकसित करने के लिए इन अल्फा बीजों का उपयोग करते हुए, हमें सबसे पहले अंकुरण की ओर सबसे अच्छे मार्ग का अनुकूलन करने के लिए मशीन लर्निंग एल्गोरिदम का आह्वान करना चाहिए।

एक त्वरित अनुस्मारक के लिए, यहाँ एपीएम I में एपीएम का निर्णय ट्री दिखाया गया है:

हमारे पास यह निर्धारित करने के लिए कई विकल्प हैं कि एपीएम कैसे निर्णय लेता है, सबसे ऊपर जड़ (बाजार की दिशा) से नीचे की तरफ पत्तियों (स्टोचैस्टिक ऑसिलेटर्स) तक पहुंचती है। अपने वर्तमान स्वरूप में, यह ये स्टोकेस्टिक ऑसिलेटर्स हैं [यहां और अधिक जानें, और यहां] जो अंततः व्यापारिक निर्णय लेते हैं और हम सर्वोत्तम संभव व्यापारिक निर्णय लेने के लिए अपने मापदंडों का अनुकूलन करना चाहते हैं।

तकनीकी रूप से कहें तो, एपीएम में भौतिकी में स्वतंत्रता की डिग्री के रूप में ज्ञात पैरामीटर हैं, और हमें उनके लिए इष्टतम विकल्प खोजने की आवश्यकता है। स्वतंत्रता की प्रत्येक डिग्री एक स्वतंत्र दिशा है जिसमें सिस्टम स्थानांतरित हो सकता है, और इष्टतम वह है जो हमें जोखिम के नियंत्रित स्तर पर उच्चतम निवेश रिटर्न देता है। हमें उस नाजुक संतुलन को खोजने की जरूरत है जिस पर हर चीज इसे हासिल करने के लिए सही तरीके से एक साथ लटके। हम बैकस्टेस्ट को चलाकर पैरामीटर स्पेस और टेस्ट परफॉर्मेंस को खोजते हैं, जो एपीएम को ऐतिहासिक मूल्य डेटा पर लागू करते हैं और इसके प्रदर्शन को मापते हैं।

आइए ग्राफिक में दर्शाए गए एपीएम के वर्तमान संस्करण के आधार पर स्वतंत्रता की डिग्री की त्वरित गणना करें:

मार्केट डायग्नोस्टिक्स के लिए, हमारे पास दिशा, अस्थिरता और प्रसार है। एक अन्य भविष्य की पोस्ट में, हम इन निदान के विवरण के बारे में भी बात करेंगे। अभी के लिए, हम उनके मापदंडों की गणना करते हैं: दिशा में पाँच हैं, अस्थिरता में चार लगते हैं, और स्प्रेड को स्वतंत्रता के कुल 13 डिग्री के लिए चार लगते हैं। एक विशिष्ट पैरामीटर एक डायग्नोस्टिक अंतर्निहित व्यापार अवधि का विकल्प है। यह अवधि 30 मिनट हो सकती है। अन्य पैरामीटर तब अक्सर उस अवधि के पूर्णांक गुणक होते हैं, जिन पर सभी संगणनाएँ की जाती हैं। इसके अतिरिक्त, वे ऊपर या नीचे थ्रेसहोल्ड मान भी हो सकते हैं, जिसमें कुछ शर्तें प्रबल होती हैं।

13 डिग्रियों की स्वतंत्रता, 10 ट्रिलियन संभावनाएँ और ब्रह्मांड की आयु

आइए एक पल के लिए निदान के साथ रहें और कुछ गिनती करें। हम पैरामीटर विकल्प ढूंढना चाहते हैं जो हमें बाजार का सर्वोत्तम संभव विवरण दें। हम ऐसा कर सकते हैं - सिद्धांत रूप में - परीक्षण और त्रुटि से। डायग्नोस्टिक्स के प्रत्येक पैरामीटर के लिए मान लें कि हम यह देखने के लिए 10 अलग-अलग मानों को आज़माना चाहते हैं कि यह कहाँ जाता है। फिर हम सभी संभावित संयोजनों को आज़मा सकते हैं और सबसे अच्छे से नज़र रख सकते हैं। आइए गिनें कि यह हमें कहाँ मिलती है:

दिशा में 10 विकल्पों के साथ 5 पैरामीटर हैं। जो 10 x 10 x 10 x 10 x 10 = 10 100,000 = 100,000 विभिन्न टायरों से निकलता है। इतना भी बेकार नहीं। दस विकल्पों के साथ अस्थिरता पैरामीटर प्रत्येक हमें 10,000 में मिलता है। स्प्रेड के लिए भी। फिर, यह बहुत बुरा नहीं लगता है।

हालाँकि, यहाँ पकड़ है: दिशा, अस्थिरता, और APM के निर्णय वृक्ष को निर्धारित करने के लिए संगीत कार्यक्रम में फैल काम। तो, हम 100,000 x 10, 000 x 10, 00 = 10 or, या शब्दों में, 10 ट्रिलियन विभिन्न विकल्पों के साथ काम कर रहे हैं, जिन्हें हमें आज़माना होगा!

खरबों के साथ काम करते समय किसी को कभी भी भारी नहीं समझना चाहिए। उदाहरण के लिए, एक ट्रिलियन डॉलर का बिल एंड-टू-एंड रखा गया, जो पृथ्वी और सूर्य के बीच की दूरी को पार कर जाएगा, और 10 ट्रिलियन ब्रह्मांड में कुल आकाशगंगाओं की संख्या के लिए एक अनुमान है [यहाँ और जानें]। अल्फा प्रिडेटर के लिए, इन 10 ट्रिलियन विकल्पों में से चुनने के लिए, यदि प्रत्येक गणना में 10 सेकंड लगते हैं और हम एक कंप्यूटर का उपयोग करते हैं, तो हम 3 मिलियन से अधिक वर्षों तक इसके लिए बने रहेंगे। इसके अलावा, यह सिर्फ मार्केट डायग्नोस्टिक्स है।

निर्णय पेड़ के साथ प्रगति करते हुए, प्रत्येक शाखा में 18 अलग-अलग पत्ते होते हैं और प्रत्येक पत्ती पर एक स्टोचस्टिक ऑसिलेटर होता है जो व्यापारिक निर्णय लेता है। हमारे पास आमतौर पर प्रत्येक स्टोचस्टिक ऑसिलेटर के लिए चार पैरामीटर हैं। सौभाग्य से, प्रत्येक थरथरानवाला दूसरों से स्वतंत्र है, इसलिए समस्या में 18 पत्तियों को जोड़ने से यह "केवल" 18,000 गुना कठिन हो जाता है: एपीएम निर्णय पेड़ के सभी संभावित मापदंडों को आज़माने के लिए 54 बिलियन वर्ष।

54.8 बिलियन वर्ष ब्रह्मांड की आयु (13.8 बिलियन वर्ष) से ​​अधिक है! यद्यपि हमारे परिष्कृत रोगी स्वभावों द्वारा परिभाषित किया गया है, हम ब्रह्मांड की उम्र तक यहां सीमित हैं, इसलिए हमारे पास कोई विकल्प नहीं है, हमें एपीएम को बहुत, बहुत जल्द, अनुकूलित करने के लिए बेहतर तरीके की आवश्यकता है।

मशीन लर्निंग बायेसियन ऑप्टिमाइज़ेशन के माध्यम से

सौभाग्य से, हमारे कम्प्यूटेशनल और डेटा वैज्ञानिकों की टीम की मशीन सीखने में एक मजबूत पृष्ठभूमि है। यह वैज्ञानिक और इंजीनियरिंग अनुशासन है जो आधुनिक कंप्यूटर की शक्ति और उन्नत गणितीय मॉडलिंग तकनीकों का लाभ उठाता है जिससे कंप्यूटर एल्गोरिदम को सीखने और अच्छी तरह से सूचित निर्णय लेने में मदद मिलती है।

अधिकांश मशीन लर्निंग एल्गोरिदम में अज्ञात पैरामीटर होते हैं जिन्हें सबसे अच्छे तरीके से समायोजित करने की आवश्यकता होती है। संभव सबसे अच्छा तरीका कुछ नुकसान फ़ंक्शन (चित्र 1 देखें) के रूप में परिभाषित किया गया है, जिसे आप कम से कम करना चाहते हैं। हमारे मामले में, यह संचयी रिटर्न का नकारात्मक हो सकता है। इस प्रकार, नुकसान फ़ंक्शन को कम करने के लिए, हमें मापदंडों को अनुकूलित करने की आवश्यकता है। हालांकि, जब गैर-अलग-अलग फैंटमैगोरिकल जानवरों से निपटना होता है, तो हमें मशीन सीखने की एक विशेष विधि को बायेसियन अनुकूलन के रूप में जाना जाता है।

बेज़ियन ऑप्टिमाइज़ेशन न्यूटन के तरीके या सीमित-मेमोरी BFGS जैसे मानक दिनचर्या से थोड़ा अलग है क्योंकि यह अनुकूलन के लिए एक मशीन लर्निंग दृष्टिकोण है। कुछ और मानक के बजाय इसका उपयोग करने का कारण यह है क्योंकि एपीएम एक अजीब कार्य है। डेटा को देखते हुए, हम रिटर्न को अधिकतम करने के लिए APM के मापदंडों का अनुकूलन कर रहे हैं। यह खुद को अधिक सामान्य अनुकूलन दृष्टिकोणों के लिए उधार नहीं देता है क्योंकि इसे चलाने में बहुत लंबा समय लगता है (मिनट, पारंपरिक दृष्टिकोण में सेकंड की तुलना में), और आप मूल फ़ंक्शन के ढाल नहीं ले सकते हैं (आपको वास्तव में ढाल की आवश्यकता है अधिकतम / मिनट तक छोटे कदम उठाने के लिए)। बायेसियन ऑप्टिमाइज़ेशन इस सरोगेट फ़ंक्शन का निर्माण करता है, जो चिकनी और भिन्न होता है। सरोगेट फ़ंक्शन का निर्माण करना मशीन सीखने का हिस्सा है। सरोगेट फ़ंक्शन को न्यूनतम तक ट्रेस करना अनुकूलन है।

अंजीर। 1 एक उदाहरण दो आयामी सरोगेट सतह। सबसे छोटा नुकसान सरोगेट सतह के न्यूनतम स्तर पर प्राप्त किया जाता है-सबसे गहरा नीला क्षेत्र जहां obtained_1 = -2 और obtained_2 / 2 है।

यहां देखिए यह कैसे काम करता है। गणितीय रूप से, APM बैकटेस्ट का परिणाम (जैसे, कुल रिटर्न, अधिकतम ड्रॉडाउन [यहाँ और अधिक सीखें] या अपनी पसंद का कोई अन्य प्रदर्शन मीट्रिक), चर x = {X1, x2 का एक कार्य f (x) है। x3, x4,…} एपीएम स्वतंत्रता के कई अलग-अलग डिग्री का प्रतिनिधित्व करता है। सादगी के लिए, चलो कुल रिटर्न = f (x) के साथ रहें। हम वैश्विक स्तर पर अधिकतम च (x) प्राप्त करने वाले पैरामीटर x को खोजकर कुल रिटर्न को अधिकतम करना चाहते हैं।

इस समस्या के लिए बेयस ऑप्टिमाइज़ेशन काम करता है इसका कारण दो मान्यताओं पर निर्भर करता है: पैरामीटर स्पेस में चिकनाई का कुछ स्तर है, और चिकनाई का स्तर आइसोट्रोपिक (हर जगह समान है)। अनुकूलन की प्रक्रिया के दौरान पैरामीटर स्पेस के पड़ोसी क्षेत्रों के बीच चिकनाई, या "समानता का स्तर" की मात्रा सीखी जाती है ताकि पहली धारणा को कुछ हद तक सत्यापित किया जा सके। पैरामीटर स्पेस में अगला बिंदु दो लक्ष्यों, अन्वेषण और अधिकतमकरण के संतुलन द्वारा चुना जाता है। सरोगेट फ़ंक्शन का पैरामीटर पैरामीटर के उन क्षेत्रों में अनिश्चितता का वर्चस्व है, जिन्हें खोजा नहीं गया है। कभी-कभी यह पास के बिंदु को बढ़ाता है जो कि च (x) को बढ़ाता है, कभी-कभी यह एक ऐसे क्षेत्र में एक बिंदु की कोशिश करेगा, जिसकी अभी तक खोज नहीं की गई है।

ऑप्टिमाइज़ेशन प्रक्रिया के इनपुट के रूप में, हमें प्रत्येक x मान लेने वाले मानों की संभावित सीमा प्रदान करने की आवश्यकता है। उदाहरण के लिए, हम यह तय कर सकते हैं कि हम n मार्केट पीरियड में एक इंडिकेटर मात्रा को औसत करना चाहते हैं, जहाँ हम n को 100 से 300 तक भिन्न कर सकते हैं। इसलिए इस पैरामीटर के लिए हमारी सीमा 100 से 300 है। हम सभी मापदंडों के लिए एक सीमा निर्धारित करते हैं। यह हमें एक उच्च-आयामी हाइपरक्यूब देता है जो उस स्थान को परिभाषित करता है जिसमें अनुकूलक संचालित होता है। इसके अतिरिक्त, हम मापदंडों के बीच संबंधों पर बाधाओं को रख सकते हैं। उदाहरण के लिए, हम यह लागू कर सकते हैं कि एक पैरामीटर हमेशा दूसरे से छोटा होता है, जो एक दीर्घकालिक और अल्पकालिक चलती औसत के साथ काम करते समय आवश्यक होता है।

हम हाइपरक्यूब से पैरामीटर मानों x का नमूना लेकर चलाए गए बायेसियन अनुकूलन को तैयार करते हैं ताकि हाइपरक्यूब के सभी क्षेत्रों का प्रतिनिधित्व किया जाए। हम तब f (x) की गणना करने के लिए APM चलाते हैं। यह नमूना ऑप्टिमाइज़र को x और f (x) का प्रारंभिक सेट देता है जिसके साथ काम करना है। फिर, हमारा लक्ष्य x का मान ज्ञात करना है जो f (x) को अधिकतम करता है।

अगला, x और f (x) के प्रारंभिक सेट के आधार पर, ऑप्टिमाइज़र एक सांख्यिकीय मॉडल बनाता है जो लगभग वर्णन करता है कि f कैसे x पर निर्भर करता है। इसे सरोगेट मॉडल कहा जाता है। सरोगेट मॉडल का उपयोग तब x के नए मूल्य की भविष्यवाणी करने के लिए किया जाता है जिसमें च (x) बढ़ने की उच्च संभावना होती है। APM को इस नए x के साथ चलाया जाता है, और परिणामस्वरूप f (x) रिकॉर्ड किया जाता है और अगले चरण में उपयोग किया जाता है।

प्रारंभ में, पूर्वानुमान बहुत सटीक नहीं हैं, लेकिन प्रक्रिया को दोहराया जाता है। प्रत्येक पुनरावृत्ति के साथ, सरोगेट मॉडल में अधिक जानकारी जोड़ी जाती है, और इसमें सुधार होता है।

यह सीखता है!

इस तरह, हम APM के लिए इष्टतम पैरामीटर पा सकते हैं, तो खरबों की तुलना में f (x) के केवल कुछ सैकड़ों मूल्यांकन की आवश्यकता होती है, अगर हम मशीन सीखने के बिना एक सरल, जानवर-बल दृष्टिकोण का उपयोग कर रहे थे।

बायेसियन अनुकूलन एक मजबूत तकनीक है, इसलिए यह आश्चर्यजनक नहीं है कि यह विज्ञान और इंजीनियरिंग के कई क्षेत्रों में दिखाई देता है। उदाहरण के लिए, बायेसियन ऑप्टिमाइज़ेशन का उपयोग प्रयोगात्मक अध्ययनों के लिए सेटअप को अनुकूलित करने और तरल गतिकी या भूभौतिकी के लिए पूर्वानुमान मॉडल के सर्वोत्तम मापदंडों को खोजने के लिए किया गया है। एपीएम के साथ हमारा काम एक आवेदन दिखाता है कि कैसे बायेसियन अनुकूलन मात्रात्मक वित्त में एक शक्तिशाली उपकरण हो सकता है।

निष्कर्ष

जैसा कि शिकारी धीरे-धीरे दूर चला जाता है, नवोदित अल्फा प्रसार उद्यान के पीछे यह धैर्यपूर्वक खेती कर रहा है, हम अपनी सांस को पकड़ने और जो हमने सीखा है उस पर चिंतन करने के लिए एक पल खर्च कर रहे हैं। बायेसियन ऑप्टिमाइज़ेशन की मशीन लर्निंग तकनीक का उपयोग करके, हम गणितीय सरोगेट सतह के नुकसान फ़ंक्शन को कम कर सकते हैं जो कि अल्फा प्रीडेटर मॉडल पैरामीटर स्पेस में फैलता है, जिससे हमें जोखिम के नियंत्रित स्तरों पर हमारे निवेश रिटर्न का अनुकूलन करने की अनुमति मिलती है। एपीएम का यह अनुकूलन और कार्यान्वयन ब्लॉकफोर्स कैपिटल में हमारे समग्र अल्फा प्रीडेटर क्वांटिटेटिव इकोसिस्टम का केवल एक हिस्सा है, जिसमें हम मध्यस्थता और हमारे मालिकाना टोकन रोटेशन मॉडल [दोनों को भविष्य के लेखों में चर्चा करने के लिए] का उपयोग करते हैं।

इस बीच, अपने कदम को देखें जैसे ही आप बगीचे में जाते हैं, शिकारी शिकारी के लिए।

ब्लॉकफोर्स कैपिटल किसी भी निवेश निर्णय के आधार के रूप में प्रस्तुत की गई जानकारी के लिए इरादा नहीं करता है। जानकारी सारांश रूप में दी गई है और पूर्ण होने का उद्देश्य नहीं है। इस सामग्री का एकमात्र उद्देश्य सूचित करना है, और किसी भी तरह से किसी भी सुरक्षा, अन्य निवेश या सेवाओं को खरीदने या बेचने के लिए, या किसी भी फंड या जमा को आकर्षित करने के लिए एक प्रस्ताव या याचना करने का इरादा नहीं है, और न ही किसी भी प्रतिभूतियों की पेशकश या बेची जाएगी किसी भी क्षेत्राधिकार में किसी भी व्यक्ति के लिए जिसमें कोई प्रस्ताव, याचना, खरीद या बिक्री ऐसे क्षेत्राधिकार के कानूनों के तहत गैरकानूनी होगा। ऐसा कोई भी प्रस्ताव केवल मान्यताप्राप्त निवेशकों को औपचारिक भेंट दस्तावेजों के माध्यम से अर्हता प्राप्त करने के लिए किया जाएगा, जिसकी शर्तें सभी प्रकार से लागू होंगी। यह जानकारी सामान्य या व्यक्तिगत निवेश सलाह का गठन नहीं करती है या व्यक्तिगत वित्तीय परिस्थितियों या निवेश उद्देश्यों, या इसे पढ़ने वाले व्यक्तियों की वित्तीय स्थितियों को ध्यान में रखती है। किसी भी सुरक्षा को खरीदने का निर्णय लेने के आधार के रूप में इस जानकारी का उपयोग करने के प्रति आपको सावधान किया जाता है। पिछले प्रदर्शन भविष्य के परिणामों की कोई गारंटी नहीं होते हैं।

मूल रूप से www.blockforcecapital.com पर प्रकाशित।