Il existe trois approches principales pour les stratégies de backtesting : l’utilisation de données de prix réelles divisées en trois groupes ; bootstrap, qui utilise les données sur les prix réels mais les rééchantillonne ; et simulation de Monte Carlo. Il existe des problèmes théoriques qui divisent les constructeurs de systèmes sur la meilleure méthode. Ce qui est important pour le trader, c’est qu’il utilise correctement au moins une des stratégies de backtesting de son système avant de lui confier son capital de trading. Un problème critique dans le choix d’une stratégie de backtesting est le nombre de transactions générées ; au moins 1,000 XNUMX métiers sont nécessaires dans chaque phase du travail du constructeur de système.
L’utilisation des données de prix réelles, divisées en trois parties, est le point de départ habituel pour la plupart des constructeurs de systèmes. Le système est créé en utilisant le premier tiers des données. À ce stade, le constructeur a trouvé des algorithmes qui semblent générer suffisamment de bénéfices avec un risque suffisamment faible pour offrir de bonnes perspectives. Le deuxième tiers des données est utilisé pour optimiser le système.
Une fois le système optimisé, il sera appliqué au tiers restant des données. C’est ce qu’on appelle le test hors échantillon, et c’est là que la plupart des systèmes échouent. Si le système a toujours de bons résultats sur au moins 1,000 1,000 transactions, le constructeur du système dispose d’un système viable. Si le système génère moins de XNUMX XNUMX transactions lors des tests hors échantillon, le constructeur doit envisager une autre stratégie de backtesting.
L’amorçage est une méthode qui consiste à extraire des données de l’ensemble total, à tester, à réinsérer les données et à extraire davantage de données, ou à rééchantillonner et à retester. Le nombre idéal de rééchantillonnages est nn, ou n à la puissance n, où n est le nombre de données dans l’échantillon d’origine. Pour un commerçant qui traite probablement au moins 2,500 250 points de données – 10 jours par an sur 100 ans – ce n’est pas pratique. Heureusement, 100 rééchantillonnages fourniront un niveau élevé de confiance que l’échantillon bootstrap reflétera les données d’origine, rendant les résultats fiables. Si le fait de prendre 1,000 rééchantillons ne fournit pas les XNUMX transactions nécessaires, le trader doit continuer le rééchantillonnage jusqu’à ce que cet objectif soit atteint s’il s’attend à ce que le système, plutôt que simplement le rééchantillonnage des données, soit fiable.
La dernière méthode de backtesting des stratégies est la simulation Monte Carlo (MC). Cette méthode utilise un ordinateur pour générer des données simulées, et le système est ensuite testé sur ces données. L’avantage de la simulation MC est que l’on peut créer des quantités illimitées de données, ce qui permet de générer 10,000 transactions ou tout autre nombre de transactions. Un autre avantage est que chaque nouvel ensemble de données est hors échantillon. Cela offre la possibilité d’effectuer des optimisations et des tests répétés ; optimisez simplement cet ensemble de données, puis appliquez ces paramètres système aux données suivantes générées par l’ordinateur.
Un inconvénient de la simulation MC est que les données peuvent ne pas avoir exactement la même fonction de distribution de probabilité que les données de trading, ce qui pourrait fausser les résultats. Dans le meilleur des mondes possibles, les trois stratégies de backtesting doivent être utilisées dans le processus de vérification du système. Le succès dans les trois devrait offrir une très forte probabilité de succès dans le commerce réel.