Backtest du modèle
Prédictions hors échantillon sur plus de 4 000 actions démontrant une véritable capacité prédictive
Performance de la stratégie
Rendements simulés des stratégies de sélection Top 20 actions, rééquilibrés à chaque période
Rendements cumulatifs (courbe d'équité)
Rendements par période par stratégie
Rendements du portefeuille Long vs Short
Drawdown de la stratégie
Statistiques de performance
| Métrique | Valeur | Description |
|---|---|---|
| Prédictions totales | Chargement... | Nombre de prédictions d'actions individuelles pendant la période de test |
| Tickers uniques | Chargement... | Nombre d'actions différentes avec des prédictions |
| IC de Spearman | Chargement... | Corrélation de rang entre les rendements prévus et réels (Coefficient d'Information) |
| Erreur absolue moyenne | Chargement... | Amplitude moyenne de l'erreur de prédiction |
| Précision directionnelle | Chargement... | Pourcentage de prédictions avec le signe correct (hausse/baisse) |
| Top 20 Rendement Long-Short | Chargement... | Rendement cumulatif de l'achat des meilleures 20 et de la vente des pires 20 prédictions à chaque période |
| Top 20 Rendement Long uniquement | Chargement... | Rendement cumulatif de l'achat des meilleures 20 prédictions à chaque période |
| Début de la période de test | Chargement... | Première date de prédiction dans l'ensemble de test |
| Fin de la période de test | Chargement... | Dernière date de prédiction dans l'ensemble de test |
Méthodologie
Tests hors échantillon
Ce backtest affiche des prédictions réalisées sur des données que le modèle n'a jamais vues pendant l'entraînement. Le modèle a été entraîné sur des données antérieures à septembre 2022, et ces prédictions sont à partir de janvier 2024, garantissant une séparation complète entre les données d'entraînement et de test.
Lors du développement, nous avons divisé les données historiques en ensembles d'entraînement, de validation et de test avec des périodes d'embargo appropriées pour éviter toute fuite de données. L'ensemble de validation est utilisé pour ajuster les hyperparamètres et sélectionner la meilleure configuration du modèle sans toucher à l'ensemble de test. Une fois les paramètres optimaux déterminés par validation, le modèle de production final est entraîné sur l'historique complet des données disponibles. Cela garantit des performances optimales avec un modèle toujours à jour.
Horizons de prédiction
Basculez entre les rendements prévisionnels à 1 mois et 3 mois. Les prédictions à 1 mois prévoient les rendements des actions sur les 30 prochains jours, tandis que les prédictions à 3 mois prévoient les rendements sur 90 jours. Les deux démontrent la capacité du modèle à identifier des opportunités surpassant le marché.
Lire le graphique
Chaque point représente une prédiction unique. L'axe X montre ce que le modèle a prédit, et l'axe Y montre ce qui s'est réellement passé. La ligne de régression verte montre la relation réelle entre les prédictions et les résultats - une pente positive indique un pouvoir prédictif.
Statistiques clés
L'IC de Spearman (Coefficient d'Information) mesure la correspondance entre le classement des rendements prédits et celui des rendements réels. La précision directionnelle indique à quelle fréquence le modèle prédit correctement si une action va monter ou baisser. Des valeurs plus élevées indiquent de meilleures performances prédictives.
Reproduire cette stratégie
La performance de la stratégie présentée ci-dessus peut être reproduite en utilisant notre plateforme. Voici comment cela fonctionne :
- Sélectionnez votre horizon : Choisissez les prédictions à 1 mois ou 3 mois selon votre horizon d'investissement.
- Construisez votre portefeuille long : Sélectionnez les 20 meilleures actions avec les rendements prévus les plus élevés. Ce sont vos positions d'achat, chacune pondérée à 5% de votre portefeuille.
- Construisez votre portefeuille short (optionnel) : Sélectionnez les 20 actions avec les rendements prévus les plus bas. Ce sont vos positions de vente à découvert pour une stratégie long-short.
- Rééquilibrez périodiquement : Pour les prédictions à 1 mois, rééquilibrez mensuellement. Pour les prédictions à 3 mois, rééquilibrez trimestriellement. Cela garantit que votre portefeuille détient toujours les actions les plus prometteuses.
Liens rapides :
Voir les meilleures prédictions (Long) — Trouvez les meilleures opportunités d'achat
Voir les pires prédictions (Short) — Trouvez des candidats potentiels pour la vente à découvert
Optimiseur de portefeuille — Créez des portefeuilles diversifiés et optimisés pour le risque à partir de vos sélections
Comprendre la finance quantitative : guide d'introduction
L'intersection de l'apprentissage automatique et de la finance représente l'un des domaines les plus exigeants intellectuellement dans la recherche quantitative moderne. Ci-dessous, nous fournissons un aperçu concis des fondements théoriques sous-jacents aux systèmes de trading algorithmique.
Apprentissage automatique financier
Le problème de la prédiction
Contrairement aux applications traditionnelles de ML, les marchés financiers présentent plusieurs caractéristiques uniques qui rendent la prédiction exceptionnellement difficile :
- Faible rapport signal/bruit : Les rendements des actifs contiennent principalement du bruit, les signaux prédictifs n'expliquant souvent que moins de 5% de la variance. Un IC de Spearman de 5-10% est considéré comme excellent en pratique.
- Non-stationnarité : La dynamique des marchés évolue dans le temps. Les relations qui tenaient dans un régime peuvent s'inverser dans un autre, nécessitant des modèles adaptatifs et une validation rigoureuse.
- Nature adversariale : Les marchés sont compétitifs — les signaux rentables attirent des capitaux jusqu'à ce qu'ils soient arbitrés. Cette 'dégradation de l'alpha' signifie que les modèles nécessitent une recherche et un raffinement continus.
Validation croisée en finance
La validation croisée k-fold standard est inappropriée pour les données temporelles en raison des dépendances temporelles. Nous utilisons :
- Validation croisée purgée : Élimination des échantillons près de la frontière entraînement-test pour empêcher les fuites d'information dues aux horizons de prédiction chevauchants.
- Périodes d'embargo : Ajout de zones tampon entre les périodes d'entraînement et de test, généralement égales à la durée de l'horizon de prédiction.
- CV purgée combinatoire : Test de multiples combinaisons entraînement/test tout en maintenant l'intégrité temporelle, fournissant des estimations hors échantillon robustes.
Ingénierie des caractéristiques
Les données de prix brutes doivent être transformées en caractéristiques stationnaires et prédictives. Les transformations courantes comprennent les rendements (arithmétiques et logarithmiques), les scores z, les rangs percentiles et les indicateurs techniques. Le choix de la mise à l'échelle et de la normalisation des caractéristiques impacte significativement les performances du modèle.
Gestion des risques financiers
Mesures fondamentales du risque
La gestion professionnelle de portefeuille nécessite une quantification rigoureuse du risque :
- Volatilité (σ) : L'écart-type des rendements, généralement annualisé en multipliant par √252 pour les données quotidiennes. Mesure le risque total mais ne distingue pas entre hausse et baisse.
- Drawdown maximum : La plus grande baisse du pic au creux de la valeur du portefeuille. Essentiel pour comprendre les scénarios les plus défavorables et la psychologie des investisseurs — un drawdown de 50% nécessite un gain de 100% pour récupérer.
- Valeur à risque (VaR) : La perte maximale attendue sur un horizon temporel donné à un niveau de confiance spécifié (ex. : VaR 95%). Largement utilisée mais critiquée pour ne pas capturer le risque de queue.
- VaR conditionnelle (Expected Shortfall) : La perte attendue sachant que les pertes dépassent la VaR. Répond aux limites de la VaR en quantifiant la sévérité des événements de queue.
Le ratio de Sharpe
Défini comme (Rp - Rf) / σp, le ratio de Sharpe mesure les rendements ajustés au risque — le rendement excédentaire par unité de volatilité. Un ratio de Sharpe supérieur à 1,0 est généralement considéré comme bon, supérieur à 2,0 comme excellent. Cependant, soyez prudent : les ratios de Sharpe peuvent être artificiellement gonflés par l'illiquidité, l'effet de levier ou les périodes d'échantillon courtes.
Risque systématique vs. risque idiosyncratique
Le risque total se décompose en risque de marché (β × mouvements du marché) et en risque spécifique à l'entreprise. Le modèle d'évaluation des actifs financiers (CAPM) suggère que seul le risque systématique est rémunéré, car le risque idiosyncratique peut être diversifié. Les modèles factoriels modernes étendent cela à plusieurs facteurs de risque (taille, valeur, momentum, qualité).
Construction de portefeuille
Théorie moderne du portefeuille
Les travaux fondateurs de Harry Markowitz (1952) ont établi que le risque de portefeuille n'est pas simplement la moyenne pondérée des risques individuels des actifs—les corrélations comptent. Deux actifs avec une corrélation imparfaite (ρ < 1) combinés produisent un portefeuille avec un risque inférieur à celui de chaque actif pris séparément.
La frontière efficiente
Pour tout objectif de rendement donné, il existe un portefeuille à variance minimale. L'ensemble de ces portefeuilles forme la frontière efficiente—les investisseurs rationnels ne devraient détenir que des portefeuilles sur cette frontière. Les points en dessous de la frontière sont sous-optimaux (même risque, rendement inférieur), tandis que les points au-dessus sont inaccessibles.
Défis de l'optimisation
L'optimisation moyenne-variance est notoirement sensible aux estimations d'entrée :
- Erreur d'estimation : Les rendements attendus sont difficiles à estimer avec précision. De petites erreurs dans les entrées peuvent conduire à des portefeuilles optimaux radicalement différents.
- Risque de concentration : L'optimisation sans contrainte produit souvent des positions extrêmes. Les implémentations pratiques imposent des limites de position et des contraintes sectorielles.
- Régularisation : Des techniques telles que les estimateurs de contraction, Black-Litterman et l'optimisation robuste aident à stabiliser les pondérations du portefeuille.
Équipondéré vs. Optimisé
Le portefeuille 1/N (équipondéré) surpasse souvent les portefeuilles optimisés hors échantillon en raison de l'erreur d'estimation. Notre backtest utilise des pondérations égales de 5% comme référence robuste. Pour des portefeuilles améliorés, notre optimiseur applique des contraintes et une régularisation pour améliorer les performances réelles.
Stratégies Long-Short sur actions
Neutralité de marché
Un portefeuille long-short à exposition neutre en dollars (expositions longues et courtes égales) a une exposition nette au marché nulle. Cela isole l'alpha de la sélection de titres tout en couvrant le risque de marché. La stratégie profite lorsque les positions longues surpassent les positions courtes, quelle que soit la direction du marché.
Sources de rendement
Les rendements long-short se décomposent en :
- Alpha long : Surperformance des positions longues par rapport au marché.
- Alpha short : Sous-performance des positions short par rapport au marché (nous profitons lorsque les shorts baissent).
- Rabais short : Intérêts perçus sur les produits des ventes à découvert (réduits par les coûts d'emprunt en pratique).
Considérations pratiques
L'implémentation réelle implique des coûts de transaction (commissions, écarts bid-ask), l'impact sur le marché (déplacement des prix contre vous), des contraintes de vente à découvert (exigences de localisation, coûts d'emprunt) et des limites de capacité. Ces frictions réduisent les rendements réalisés par rapport aux backtests théoriques.
Fréquence de rééquilibrage
Un rééquilibrage plus fréquent capture l'alpha plus rapidement mais engendre des coûts de transaction plus élevés. La fréquence optimale équilibre la décroissance du signal par rapport aux coûts de négociation. Pour les prévisions de rendement, un rééquilibrage mensuel ou trimestriel offre généralement un compromis favorable.
Investissement factoriel
Que sont les facteurs ?
Les facteurs sont des sources systématiques de rendement qui expliquent pourquoi certaines actions surperforment d'autres au fil du temps. Contrairement à la sélection d'actions basée sur l'analyse individuelle des entreprises, l'investissement factoriel cible des caractéristiques larges et persistantes partagées par des groupes de titres. La recherche académique a identifié de nombreux facteurs, bien que seule une poignée se soit avérée robuste à travers les marchés et les périodes.
Les facteurs classiques
- Marché (β) : Exposition au marché actions global. Le facteur original du CAPM—les actions avec un bêta plus élevé évoluent davantage avec le marché et obtiennent historiquement des rendements plus élevés (avec un risque plus élevé).
- Taille (SMB) : Les petites capitalisations ont tendance à surperformer les grandes capitalisations. Fama et French (1993) ont documenté cette prime 'small minus big', bien qu'elle se soit affaiblie ces dernières décennies.
- Valeur (HML) : Les actions avec de faibles ratios price-to-book surperforment les actions de croissance au fil du temps. Ce facteur 'high minus low' reflète l'achat d'actifs bon marché et la vente d'actifs chers.
- Momentum (UMD) : Les actions qui ont bien performé au cours des 3 à 12 derniers mois ont tendance à continuer à surperformer. Jegadeesh et Titman (1993) ont documenté cet effet 'up minus down' sur les marchés.
- Qualité (QMJ) : Les entreprises avec une rentabilité élevée, des bénéfices stables et un faible effet de levier surperforment. Asness et al. (2019) ont formalisé ce facteur 'quality minus junk'.
- Faible volatilité : Paradoxalement, les actions à faible risque offrent souvent des rendements ajustés au risque plus élevés que les actions à haut risque, contredisant les prédictions de base du CAPM.
Modèles factoriels
Les modèles multi-facteurs décomposent les rendements en composantes systématiques :
- Fama-French 3 facteurs : Marché + Taille + Valeur. Explique environ 90% des rendements des portefeuilles diversifiés.
- Carhart 4 facteurs : Ajoute le Momentum au modèle Fama-French.
- Fama-French 5 facteurs : Ajoute les facteurs Rentabilité et Investissement, bien que le Momentum reste significatif.
Timing factoriel vs. Exposition aux facteurs
L'exposition factorielle statique (toujours orientée vers la valeur, le momentum, etc.) a historiquement récompensé les investisseurs patients. Le timing factoriel — ajuster dynamiquement les pondérations des facteurs — est bien plus difficile. Les facteurs peuvent sous-performer pendant des années avant de s'inverser, et les signaux de timing sont notoirement peu fiables. La plupart des praticiens recommandent une exposition factorielle diversifiée et constante plutôt qu'une allocation tactique.
Apprentissage automatique et facteurs
Notre modèle de prédiction capture implicitement les expositions aux facteurs à travers ses caractéristiques. En apprenant des motifs à partir de données fondamentales, du momentum des prix et des conditions de marché, le modèle identifie les actions susceptibles de surperformer — combinant efficacement plusieurs facteurs de manière data-driven. Cette approche peut découvrir des interactions factorielles non linéaires que les modèles linéaires traditionnels manquent.
Avertissement important
Les performances passées ne garantissent pas les résultats futurs. Les résultats de backtest présentés ici sont basés sur des données historiques et peuvent ne pas être représentatifs des performances futures. Les investissements boursiers comportent des risques, y compris la perte potentielle du capital. Les prédictions affichées sont uniquement à des fins d'information et ne doivent pas être considérées comme des conseils financiers. Consultez toujours un conseiller financier qualifié avant de prendre des décisions d'investissement.