Dans le cadre de la sélection initiale de toutes les actions A, les critères de sélection initiale sont généralement basés sur des indicateurs de base tels que le moment de la mise sur le marché ou la valeur marchande. Dans l'espace d'échantillonnage, le premier groupe de titres est sélectionné. Les conditions de sélection sont généralement basées sur des données de l'industrie, des indicateurs financiers, de la rentabilité, etc. Le premier groupe de titres sera un échantillon du modèle de sélection multifactoriel. Le modèle multifactoriel est utilisé pour quantifier les actions choisies. Les facteurs traditionnels comprennent principalement les facteurs financiers (taux de rentabilité, taux de rentabilité, taux de vente, taux de valeur des actifs, taux de croissance des revenus de l'entreprise principale, taux de croissance des bénéfices nets, taux de croissance des EPS, taux de croissance des actifs totaux, etc.) et les facteurs moteurs du marché (taux de rentabilité à court terme, taux de rentabilité à long terme, taux de fluctuation spécifique, variation du volume des transactions, valeur marchande libre). L'apprentissage du moteur de quantification est utilisé pour calculer les parts et les pondérations des composants du fonds.
Les fonds de Big Data sont donc différents des fonds traditionnels.
Avant, lorsque nous avons créé le modèle de sélection de titres multifactoriels, les facteurs utilisés provenaient tous de l'intérieur du marché, nous nous concentrions sur les attributs d'un titre lui-même, mais l'introduction de facteurs de Big Data a apporté de nouvelles informations, nous nous soucierons de savoir si les changements de volume de recherche sur Baidu sont liés aux changements de titres.
Nous avons donné l'exemple d'une véritable fondation de Big Data pour vous aider à mieux comprendre les facteurs du Big Data.
L'exemple choisi ici est le Big Data 100 de Taobao Gold, lancé par la Fondation Boehringer Ingelheim en partenariat avec le groupe de couture.
Lors de la construction de l'espace de sélection, Taobao Big Data 100 a choisi comme espace de sélection les actions pertinentes des secteurs de la troisième tranche de CET liées aux catégories de produits de commerce électronique en ligne, y compris les catégories suivantes:
Basé sur l'espace d'échantillonnage des secteurs liés à Taobao, le fonds de Boochie et la société de placement ont généré des actions sélectionnées pour les modèles de quantification multifactoriels. La plate-forme d'information financière de Paypal fournit des données statistiques sur les tendances de la consommation en ligne. Selon les indicateurs de recherche de l'industrie obtenus, l'analyse globale de l'économie de l'industrie, y compris la croissance, les prix, les conditions de l'offre, etc., est classée par économie de l'industrie.
Enfin, les modèles de sélection quantitative utilisent des facteurs de Big Data, des facteurs financiers et des facteurs de marché pour classer les actions, déterminant les composantes et les poids des fonds Big Data.
En plus de l'indice Taobao 100, les grands fonds utilisent également des facteurs de données générés par de nombreuses sources de données telles que Baidu, Snowball, Sina, Fed, etc. Les facteurs utilisés par les grands fonds sont les suivants:
Facteurs de recherche pour le 100
Pour les stocks de l'espace de l'échantillon, le nombre total de recherches et le nombre de recherches augmentées pour le dernier mois sont calculés et enregistrés comme facteurs de nombre total et de nombre d'incrémentations, respectivement; pour les facteurs de nombre total de recherches et de nombre d'incrémentations, un modèle d'analyse factuelle est construit pour calculer le score global des actions par période et enregistré comme facteur de recherche;
Les données de 100 tonnes de la boule de neige, le facteur thermique
Tout d'abord, la couverture de l'échantillon à sélectionner est calculée sur la base de la combinaison d'intelligence des boules de neige obtenue dans la deuxième étape; ensuite, une note est donnée aux actions en fonction de la couverture de l'intelligence des boules de neige des actions.
Le facteur de la grande donnée de Sinaï du Sud
Le nombre de clics sur les pages de la chaîne financière Sina, les articles négatifs du microblogging, l'impact des reportages.
Indice du Big Data de la Banque centrale américaine
Les données statistiques sur les tendances caractéristiques des catégories de consommation de la Banque centrale ont été traitées pour obtenir un indicateur de recherche sur l'industrie; ensuite, selon les indicateurs de recherche sur l'industrie obtenus, l'économie de l'industrie a été examinée de manière globale, y compris: le montant de la consommation, le nombre de transactions, etc., a été classée par l'économie de l'industrie; enfin, selon l'économie, les actions de l'industrie ont reçu une note correspondante et un facteur de données majeures de l'industrie a été obtenu.
Beaucoup de gens pensent que les performances des fonds de Big Data sont en fait très médiocres, en fait, jusqu'à présent, les performances de plusieurs fonds de Big Data n'ont pas atteint les attentes initiales, mais cela ne nous amène pas à conclure que les fonds de Big Data sont dans la mauvaise direction. Comme les applications actuelles du Big Data restent conservatrices et expérimentales, nous n'avons ajouté que des facteurs de Big Data sur la base du modèle multifonctionnel traditionnel et n'avons pas apporté d'innovations plus subversives au modèle lui-même.
En effet, les applications du Big Data touchent depuis longtemps tous les aspects de nos vies, où il y a des trésors de valeur d'investissement, et bien que les résultats des fonds de Big Data existants n'aient pas encore montré qu'ils avaient la capacité d'exploiter efficacement ces valeurs, les trésors du Big Data sont toujours là, et peut-être que certains hauts fonctionnaires les ont déjà appréciés.
Transférée de Investissements scientifiques à investissements vérifiés