सभी ए शेयरों में से प्रारंभिक चयन के लिए जगह निकालें, प्रारंभिक चयन मानक आम तौर पर सूचीबद्ध समय, बाजार मूल्य आदि जैसे अधिक बुनियादी संकेतकों को लेते हैं। स्टार्ट-अप स्टॉक पूल का चयन नमूना स्थान से किया जाता है, जिसमें आमतौर पर उद्योग के आंकड़ों, वित्तीय संकेतकों, लाभप्रदता आदि का उपयोग किया जाता है। स्टार्ट-अप स्टॉक पूल को मल्टीफैक्टर स्टॉक चयन मॉडल के नमूने के रूप में उपयोग किया जाता है। एक बहु-कारक स्टॉक चयन मॉडल का उपयोग करके स्टॉक की मात्रा का चयन करें। पारंपरिक बहु-कारक मॉडल द्वारा लिए गए कारक में मुख्य रूप से वित्तीय कारक (मार्जिन दर, बाजार की शुद्ध दर, बाजार की बिक्री दर, परिसंपत्ति मूल्य अनुपात, मुख्य व्यवसाय आय वृद्धि दर, शुद्ध लाभ वृद्धि दर, ईपीएस वृद्धि दर, कुल परिसंपत्ति वृद्धि दर, आदि) और बाजार संचालित कारक (लघु अवधि में रिटर्न दर, दीर्घकालिक रिटर्न दर, विशिष्ट अस्थिरता दर, लेनदेन की मात्रा में परिवर्तन, मुक्त बाजार मूल्य) आदि शामिल हैं। इन सभी कारकों के आधार पर, दीर्घकालिक ऐतिहासिक रिटर्न और स्थिरता को अधिकृत किया जाता है, केवल एक शेयर के लिए एक समग्र स्कोर की गणना की जाती है। एक कोंटिमेट इंजन के माध्यम से सीखने के लिए फंड के घटक शेयरों और उनके संबंधित भारों की गणना करें।
तो, बिग डेटा फंड और पारंपरिक फंडों में क्या अंतर है?
पहले जब हम एक बहु-कारक स्टॉक चयन मॉडल बनाते थे, तो हम सभी बाजार के भीतर से आने वाले कारकों का उपयोग करते थे, हम सभी शेयरों के गुणों पर ध्यान देते थे, लेकिन बड़े डेटा कारकों की शुरूआत ने नई जानकारी ला दी, हम शेयरों के परिवर्तन के साथ प्रति सेंटीमीटर खोज की मात्रा में परिवर्तन पर ध्यान देंगे, हम Taobao पर ध्यान देंगे कि क्या किसी उद्योग की बिक्री उद्योग के भीतर कंपनियों के शेयरों की कीमतों को प्रभावित करती है, हम यह भी ध्यान देंगे कि सिनाना वित्तीय क्षेत्र में किसी एक शेयर से संबंधित समाचारों के पढ़ने की संख्या और टिप्पणियों की संख्या का शेयरों की कीमतों के उतार-चढ़ाव पर प्रभाव पड़ता है।
हम एक वास्तविक Big Data Fund का उदाहरण देते हैं ताकि आप Big Data के कारकों को बेहतर ढंग से समझ सकें।
उदाहरण के लिए, बोर्स फंड ने ट्विन-गोल्ड के साथ मिलकर Taobao Big Data 100 लॉन्च किया है।
नमूना स्थान के निर्माण में, Taobao Big Data 100 ने अपने नमूना स्थान के रूप में ऑनलाइन ई-कॉमर्स कमोडिटी कैटेगरी से संबंधित सीईटी स्तर 3 उद्योग के संबंधित शेयरों का चयन किया, जिसमें निम्नलिखित श्रेणियां शामिल हैंः
घरेलू टिकाऊ उपभोग्य सामग्रियां
अवकाश उपकरण और आपूर्ति
कपड़ा और वस्त्र
होटल रेस्तरां और अवकाश
खाद्य और आवश्यक वस्तुओं की खुदरा बिक्री
खाद्य और पेय
घरेलू सामान
व्यक्तिगत सामान
Taobao से संबंधित उद्योगों के नमूने के आधार पर, बोर्ज़ फंड और एपीआई ने एक बहु-कारक मात्रात्मक मॉडल के लिए एपीआई ई-कॉमर्स बिग डेटा कारक के लिए स्टॉक का चयन किया है। जिसमें एपीआई वित्तीय सूचना सेवा मंच ऑनलाइन उपभोक्ता श्रेणी के सांख्यिकीय रुझान की विशेषता डेटा प्रदान करता है। उद्योग के विकास, मूल्य, आपूर्ति और मांग सहित उद्योग की स्थिति के आधार पर, उद्योग की स्थिति रैंकिंग प्राप्त की जाती है। उद्योग के भीतर शेयरों को दिए गए रेटिंग के आधार पर उद्योग की स्थिति के आधार पर, एपीआई ई-कॉमर्स बिग डेटा कारक को स्कोर किया जाता है।
अंत में, क्वांटिटेटिव स्टॉक सिलेक्शन मॉडल बड़े डेटा कारकों, वित्तीय कारकों और बाजार-संचालित कारकों का उपयोग करके स्टॉक स्कोर रैंकिंग के लिए करता है, जो बड़े डेटा फंड के घटक शेयरों और भारों को निर्धारित करता है।
Taobao 100 सूचकांक के अलावा, बड़े डेटा फंडों ने कई बड़े डेटा स्रोतों जैसे कि Baidu, Snowball, Sina और Silver Unions का उपयोग करके बड़े डेटा कारक उत्पन्न किए हैं।
100 सूचकांक खोज कारक
नमूना स्थान के शेयरों के लिए, पिछले एक महीने की खोज की कुल मात्रा और खोज की वृद्धि को अलग-अलग गणना की जाती है, क्रमशः कुल मात्रा कारक और वृद्धि कारक के रूप में दर्ज किया जाता है; खोज की कुल मात्रा कारक और वृद्धि कारक के लिए कारक विश्लेषण मॉडल का निर्माण करें, प्रत्येक स्टॉक के लिए एक समग्र स्कोर की गणना करें, जिसे खोज कारक के रूप में दर्ज किया जाता है;
बर्फ की गेंद का चयन 100 टन बर्फ की गेंद गर्मी कारक
सबसे पहले, स्नोबॉल आईटी पोर्टफोलियो के आधार पर, जो दूसरे चरण में प्राप्त होता है, चयन किए जाने वाले नमूने के आईटी पोर्टफोलियो कवरेज की गणना की जाती है; इसके बाद, स्टॉक के आईटी पोर्टफोलियो कवरेज के आधार पर, स्टॉक को एक उचित रेटिंग दी जाती है, जिसे स्नोबॉल हीट फैक्टर स्कोर के रूप में दर्ज किया जाता है।
दक्षिण सिना बड़ा डेटा सिना बड़ा डेटा कारक
समाचार चैनल पर पेज पर क्लिक, वीबो पर सकारात्मक और नकारात्मक लेखों की रिपोर्टिंग, समाचार रिपोर्टिंग का प्रभाव।
बैंक यूनियन बिग डेटा सूचकांक और बैंक यूनियन उद्योग के बड़े डेटा कारक
बैंक ऑफ बड़ौदा के उपभोग वर्ग के सांख्यिकीय रुझान की विशेषता डेटा के आधार पर प्रसंस्करण के बाद उद्योग निवेश सूचकांक प्राप्त; इसके बाद, उद्योग निवेश सूचकांक के आधार पर, उद्योग की मंदी की रैंकिंग प्राप्त करने के लिए उद्योग की मंदी की रैंकिंग प्राप्त की जाती है, जिसमें शामिल हैंः उपभोग राशि, लेनदेन की संख्या आदि; अंत में, उद्योग के बड़े डेटा कारक को प्राप्त करने के लिए उद्योग के भीतर शेयरों को दिए गए मूल्यांकन के आधार पर उद्योग की मंदी की रैंकिंग प्राप्त की जाती है।
कई जानकारों का मानना है कि बिग डेटा फंड वास्तव में खराब प्रदर्शन कर रहे हैं, वास्तव में अब तक, कुछ बड़े डेटा फंडों ने वास्तव में उम्मीदों को पूरा नहीं किया है, लेकिन यह हमें यह निष्कर्ष नहीं निकाल सकता है कि बिग डेटा फंड गलत दिशा में हैं। क्योंकि वर्तमान में बड़े डेटा के लिए आवेदन अभी भी रूढ़िवादी और प्रयोगात्मक है, हमने केवल पारंपरिक बहु-कारक मॉडल के आधार पर बड़े डेटा कारकों को जोड़ा है, और मॉडल में अधिक विघटनकारी नवाचार नहीं किया है। और बड़े डेटा कारकों के लिए उपचार में सिमेंटिक विश्लेषण, भावनात्मक विश्लेषण, विषय मॉडल और कई प्राकृतिक भाषा प्रसंस्करण और मशीन सीखने के क्षेत्र शामिल हैं।
वास्तव में, बड़े डेटा के अनुप्रयोगों ने हमारे जीवन के हर पहलू को छुआ है, जिसमें अनजाने में निवेश के लायक खजाने हैं, हालांकि मौजूदा बड़े डेटा फंडों के प्रदर्शन से यह नहीं पता चलता है कि वे इन मूल्यों को प्रभावी ढंग से खोदने की क्षमता रखते हैं, लेकिन बड़े डेटा में खजाने हमेशा से वहां रहे हैं, शायद कुछ अज्ञात उच्च वर्ग पहले से ही इसका आनंद ले रहे हैं।
विज्ञान निवेश से अनुप्रेषित