1 Introduction
De nombreux éloges ont été justement utilisés pour décrire la contribution de Black et Scholes (1973) à la théorie de l’évaluation des options. Malgré le développement ultérieur de la théorie des options, la formule originale de Black-Scholes pour une option d’achat européenne reste l’application la plus réussie et la plus largement utilisée.
Bien que la formule de Black-Scholes soit souvent assez efficace pour expliquer les prix des options sur actions [Black et Scholes (1972)], elle présente des biais connus [Rubinstein (1985)]. Sa performance est également nettement moins bonne sur les options de change [Melino et Turnbull (1990, 1991), Knoch (1992)]. Ce n’est pas surprenant, car le modèle de Black-Scholes fait l’hypothèse forte que les rendements des actions (composés en continu) sont distribués normalement avec une moyenne connues et une volatilité constante.
L’hypothèse de variance constante ne refléte pas correctement la réalité du comportement des prix des actifs. Steven L. Heston un professeur de Yale University propose dans son article intitulé «A Closed-Form Solution for Options with Stochastic Volatility with Applications to Bond and Currency Options» une nouvelle technique pour évaluer un call européen sur un actif, en considérant la volatilité comme stochastique. Avec des simulations,il a démontré que la corrélation, entre la volatilité et le prix du sous-jacent, est importante pour expliquer la skewness et les écarts par rapport au modèle à volatilité stochastique. Il a étudié l’effet de l’aspect stochastique de la volatilité sur la valeur d’une option et la comparaison du modèle correspondant avec le modèle de Black et Scholes. Il fournit une solution analytique pour le prix d’une option d’achat européenne lorsque l’actif sous-jacent est corrélé avec la volatilité, et il adapte le modèle pour incorporer des taux d’intérêt stochastiques. Ainsi, le modèle peut être appliqué aux options sur obligations et aux options de change.
2 Notions pré-requises
2.1 Notions financières
2.1.1 Actif financier
Un actif financier est un titre ou un contrat, généralement transmissible et négociable (par exemple sur un marché financier), qui est susceptible de produire à son détenteur des revenus ou un gain en capital, en contrepartie d’une certaine prise de risque. En général, on peut séparer les actifs en deux catégories : les actifs sans risque (par exemple les obligations, livrets d’épargne. . .) et les actifs risqués (par exemple les actions, les devises. . .)
2.1.2 Actif sous-jacent
L’actif sous-jacent est l’élément financier sur lequel repose la valeur d’un produit financier dérivé, Cela peut inclure des actions, des obligations, des matières premières, des devises ou d’autres types d’actifs financiers. L’actif sous-jacent détermine le comportement et la valeur du produit dérivé au fil du temps.
2.1.3 Produit dérivé
Un produit dérivé est un instrument financier dont la valeur est dérivée de l’évolution d’un actif financier sous-jacent, tel qu’une action, une obligation, une matière première ou une devise. Ils sont souvent utilisés pour se couvrir contre les risques de marché, spéculer sur les mouvements de prix, ou encore pour gérer les expositions aux fluctuations des taux de change ou des taux d’intérêt.
2.1.4 Option
Une option est un type de produit financier dérivé qui confère à son détenteur le droit, mais pas l’obligation, d’acheter (option d’achat ou “call”) ou de vendre (option de vente ou “put”) un actif financier sous-jacent à un prix convenu (prix d’exercice) à une date future prédéterminée ou avant cette date (date d’expiration). L’acheteur de l’option paie une prime pour ce droit, tandis que le vendeur de l’option reçoit cette prime en échange de l’engagement à acheter ou à vendre l’actif sous-jacent si l’option est exercée. Les options sont largement utilisées à des fins de couverture, de spéculation et de gestion des risques.
Les deux types d’options les plus courantes sont les options américaines et les options européennes. La principale différence entre ces deux types d’options réside dans les conditions d’exercice : Avec une option européenne, le détenteur a le droit d’exercer l’option uniquement à la date d’expiration prédéterminée. Cela signifie que l’option ne peut être exercée qu’à cette date spécifique. En revanche, avec une option américaine, le détenteur a le droit d’exercer l’option à tout moment entre la date d’achat de l’option et sa date d’expiration. Cela signifie que l’option peut être exercée à tout moment pendant cette période.
2.1.5 Pay-off
En finance, le mot anglais pay-off (ou payoff) se traduit généralement par bénéfice en français. Dans le cas d’une option, cette expression peut désigner aussi bien un profit qu’une perte. Le pay-off qualifie le rendement intrinsèque d’une option, après déduction de la prime d’acquisition. Ce pay-off varie en fonction des fluctuations des marchés à terme. Sa valeur réelle est calculée soit à sa date d’exercice, soit à sa date d’échéance.
2.1.6 Pricing
Le pricing (ou la tarification en français), en mathématiques financières, est le processus par lequel on fixe, en utilisant des modèles financiers, le prix auquel des options se vendront.
2.1.7 Les Grecques
les “Grecques” sont des mesures utilisées pour évaluer le risque et la sensibilité d’options par rapport à divers facteurs tels que le prix de l’actif sous-jacent, la volatilité, le temps et les taux d’intérêt.
2.1.8 Absence d’Opportunités d’Arbitrage
L’absence d’opportunités d’arbitrage se réfère à la situation sur les marchés financiers où il n’est pas possible de réaliser des bénéfices sans risque en exploitant des différences de prix entre les actifs ou les marchés. Cela signifie que les prix des actifs sont considérés comme justes et reflètent toutes les informations disponibles, éliminant ainsi la possibilité de réaliser des gains sans prendre de risques supplémentaires. En d’autres termes, les marchés sont considérés comme efficients et équilibrés.
2.1.9 Calibration
La calibration (ou le calibrage) consiste à déterminer à partir des données de marché, les paramètres du modèle financier (ici modèle de Heston) qui permettent le mieux de retrouver les prix du marché.
2.2 Notions mathématiques
2.2.1 Martingale
La notion de martingale est fondamentale pour comprendre le comportement aléatoire des prix d’actifs financiers.
-
Définition : Soit (\Omega, \mathcal{F}, \{\mathcal{F}_t\}_{t \ge 0}, \mathbb{P}) un espace de probabilité filtré, et X = \{X_t\}_{t \ge 0} un processus stochastique. On dit que X est une (\mathcal{F}_t)-martingale si :
- X est (\mathcal{F}_t)-adapté.
- X est intégrable, soit \mathbb{E}(X_t) < +\infty (autrement dit X \in L^1(\Omega)), \forall t > 0.
- \mathbb{E}(X_t | \mathcal{F}_s) = X_s pour s \le t.
2.2.2 Mouvement Brownien Standard
Pour modéliser les prix d’un actif, il est nécessaire d’introduire le concept de mouvement Brownien, qui représente le mouvement aléatoire des prix. La modélisation des prix implique également l’utilisation de calculs stochastiques, notamment l’intégrale stochastique et les équations différentielles stochastiques, basées sur le calcul d’Itô.
-
Définition : Soit X = \{X_t, t \ge 0\} = (X_t)_{t \ge 0} un processus issu de 0 et à valeurs dans \mathbb{R}. On dit que X est un mouvement Brownien standard si il vérifie l’une des 2 conditions suivantes équivalentes:
X est un processus gaussien centré de fonction de covariance: E(X_t X_s) = t s
X est un processus à accroissements indépendants et stationnaires (PAIS) gaussiens, c’est-à-dire tels que: X_t - X_s \sim N(0, t - s)
show
set.seed(1234)
n <- 10^4
S0 <- 100
temps = seq(0, 1, length = n + 1)
dt <- 1/n
accroissement <- rnorm(n, mean = 0, sd = dt)
mvt_brownien <- cumsum(c(S0, accroissement))
plot(temps,mvt_brownien, xlab = " temps", ylab = "cours de l'actif", type = "l", col = "blue", lwd = 0.8, main = "mouvement brownien")
2.2.3 Formules d’Itô
Soit f:\mathbb{R} →\mathbb{R} une fonction à 1 variable de classe C^2et Xun processus d’Itô. Alors df(X_t) = f'(X_t)dS_t + \frac{1}{2}f''(X_t)d\langle X_t\rangle
Soit f:\mathbb{R}_+×\mathbb{R} →\mathbb{R}une fonction à 2 variables de classe C^1 par rapport à $t $ de classe C^2 par rapport à x et X un processus d’Itô. Alors :
d(f(t, X_t)) = \frac{\partial f}{\partial t}(t,X_t) dt + \frac{\partial f}{\partial x}(t,X_t) dX_t + \frac{1}{2} \frac{\partial^2 f}{\partial x^2}(t,X_t)d\langle X\rangle_t
Soit f:\mathbb{R}×\mathbb{R} →\mathbb{R} une fonction à 2 variables de classe C^2 à dérivées bornées, et X, Y, deux processus d’Itô. Alors :
2.2.4 Théorème (Girsanov général)
Soient \mathbb{P} et \mathbb{Q} deux mesures de probabilité équivalentes sur un espace filtré (\Omega, \mathcal{F}_t). On suppose que toutes les \mathcal{F}_t-martingales sont continues. Alors sous \mathbb{P} il existe une $_t $-martingales $L_t = _0^t _s , dB_s $ telle que \forall t \leq T et \forall A \in \mathcal{F}_t,
\mathbb{Q}(A)=\mathbb{E}\left[ \exp {\left[ L_t - \frac{1}{2} \langle L\rangle_t \right]} \mathbb{1}_A \right]
Autrement dit tel que
\begin{align*} \frac{d\mathbb{Q}}{d\mathbb{P}} &= \exp\left( L_t - \frac{1}{2} \langle L\rangle_t \right) \\ &= \exp\left( \int_0^t \theta_s \, dB_s - \frac{1}{2} \int_0^t \theta_s^2 \, ds \right) \\ \end{align*}De plus, si M est une martingale locale continue sous \mathbb{P}, alors le processus \widetilde{M}: t ↦ M_t - \langle M,L\rangle\_t Est une martingale locale continue sous \mathbb{Q}
théorème très utile dans la pratique, puisque c’est lui qui nous permettra de trouver la probabilité risque neutre.
La probabilité risque neutre est une approche fondamentale pour le pricing en finance. Elle repose sur le principe selon lequel sous une certaine probabilité (probabilité risque neutre), le prix actualisé des actifs est une martingale(Note 1). Ainsi, il est crucial de comprendre le calcul stochastique et le théorème de Girsanov pour pouvoir trouver cette probabilité sous laquelle le prix est une martingale, en permettant le changement de probabilité.
3 Modèle de Black-Scholes
Le modèle de Black-Scholes ou modèle de Black-Scholes-Merton est un modèle mathématique du marché avec une volatilité de l’actif constante, dans lequel le prix de l’action est un processus stochastique en temps continu, par opposition au « modèle binomial » aussi nommé « modèle Cox Ross-Rubinstein » qui suit un processus stochastique en temps discret.
3.1 Hypothèses du modèle
Le modèle de Black-Scholes repose sur un certain nombre de conditions :
3.1.1 Les hypothèses sur le marché
Efficience des marchés : Les informations pertinentes sont déjà intégrées dans les prix des actifs sous-jacents;
Absence d’opportunités d’arbitrage : Ce qui signifie que les investisseurs ne peuvent pas réaliser des bénéfices sans risque en exploitant des écarts de prix entre les actifs ou les marchés;
Le taux sans risque, r, est constant et fixe quelle que soit la maturité du produit dérivé;
le temps est continu ;
-
les marchés sont parfaits :
- le marché est fluide de liquide, c’est-à-dire que l’on peut décider d’acheter ou de vendre à tout instant (pas de risque de liquidité) ;
- Le marché fonctionne en continu: Tous les actifs sont divisibles à l’infini (on peut par exemple acheter 1/100e d’action) ;
- il n’y a pas de frais de transactions ou d’impôts ;
- on peut emprunter et prêter au même taux ;
- Pas de restriction sur les ventes à découvert: on peut vendre à découvert sans pénalité. Le produit des ventes est immédiatement et intégralement disponible;
- Absence de dividendes : Il n’y a pas de paiements de dividendes sur l’actif sous-jacent pendant la durée de vie de l’option;
Le marché parfait est une notion d’économiste. Les mathématiciens ont redéfini celle-ci en « marché complet », avec une définition plus simple : Un marché est dit complet si tous les actifs sont réplicables.
Le modèle, par ses hypothèses, ne correspond pas à la réalité des marchés financiers. Mais l’utilisation de ce modèle se généralise au concept « d’imitation rationnelle ». Il permet d’avoir un moyen de modéliser les changements du marché financier, et peut aider à la prise de décision
3.1.2 Les hypothèses sur les rendements
- Volatilité constante: le prix de l’actif sous-jacent S_t suit un mouvement brownien géométrique avec une volatilité σ constante et un taux de dérive annualisé (rendement ou drift en anglais) µ constant ;
On suppose que S (prix de l’action) est un mouvement brownien géométrique. Plus précisément, sous la probabilité historique \mathbb{P} d’un espace de probabilité (Ω, \mathcal{F}, \mathbb{P}), la dynamique de S est de la forme dS_t = µS_tdt + σS_tdBt \tag{1} où - t : temps, en années ; - S_t : prix de l’actif sous-jacent S à l’instant t ; - B_t : un mouvement brownien à l’instant t ; - µ : drift de S ; - σ : la volatilité (constante) du sous-jacent.
: On applique la formule d’Itô(Note 3) à f(S_t) = ln S_t pour trouver la solution de cette EDS de Black et Scholes. Soit f(x)=ln(x); \ \ f'(x)=\frac{1}{x}; \ \ f''(x) = - \frac{1}{x^2}
On a aussi besoin de d \langle S_t\rangle = \sigma^2 S_t^2dt
Ainsi la 1ère formule d’Itô nous donne :
$$ \begin{align*} df(S_t) &= f'(S_t)dS_t + \frac{1}{2}f''(S_t)d\langle S_t\rangle \\ &= \frac{1}{S_t}(µS_tdt + σS_tdB_t) - \frac{1}{2} \frac{1}{S_t^2} \sigma^2 S_t^2dt \\ &= µdt + σdB_t - \frac{1}{2} \sigma^2 dt \\ \end{align*} $$ Ainsi, on montre que:
ln S_t = ln(S_0) +(µ - \frac{1}{2} \sigma^2 )t + σB_t
Donc on obtient l’expression:
S_t = f(t, B_t) = S_0 \exp \left( \left(µ - \frac{1}{2} \sigma^2 \right)t + σB_t \right) On observe aussi que, puisque B_t ∼ \mathcal{N} (0, t), S_t a une distribution log-normale, telle que ln S_t est normale avec une moyenne \left(\ln S_0 + (µ − \frac{1}{2}σ^2)t \right), et une variance σ^2t.
L’hypothèse principale à la base du modèle de Black-Scholes est donc la modélisation de la dynamique du sous-jacent par un mouvement brownien géométrique (modélisation des actifs par des lois lognormales)
L’EDS de Black-Scholes s’écrit : \frac{dS_t}{ S_t} = µdt + σdW_t
les rendements entre deux périodes sont mesurés par la différence des logarithmes des cours. Les rendements Log(S_t) - Log(S_s) suivent une loi gaussienne de moyenne (µ-\frac{1}{2}σ^2)(t-s) t de variance σ(t-s)
3.2 Probabilité risque neutre
Sur un espace de probabilité (Ω, \mathcal{F}, \mathbb{P}), soit (B_t)_{t≥0} un mouvement brownien de filtration naturelle (\mathcal{F}_t = σ((B_s)_{s∈[0,t])})_{t≥0}. On suppose que le prix S_t vérifie l’équation du modèle de Black-Scholes (Équation 1) et on considère: - r : le taux d’intérêt sans risque d’un emprunteur sûr dont la rentabilité est certaine sur une période donnée ; - un actif sans risque de cours S_t^0 = e^{rt}; - sous probabilité historique, un actif risqué de cours S_t = S_0e^{σB_t+(µ− \frac{σ^2}{2} )t};
On cherche la dynamique de Y_t = e^{-rt}X_t
Application de la formule d’Itô :
$$ \begin{align*} dY_t &= \frac{\partial f}{\partial t} dt + \frac{\partial f}{\partial x} dX_t + \frac{1}{2} \frac{\partial^2 f}{\partial x^2}d\langle X\rangle_t \\ &= -rY_t dt + e^{-rt} dX_t \\ &= -rX_te^{-rt} dt + e^{-rt} \mu X_t dt + \sigma e^{-rt} X_t dB_t \\ &= (\mu -r)Y_tdt + \sigma Y_tdB_t \end{align*} $$
Y_t n’est pas une martingale sous la probabilité historique \mathbb{P}. Mais si on réécrit : dY_t = \sigma Y_t \left( dB_t + \frac{\mu -r}{\sigma} dt \right) = \sigma Y_t d\widetilde{B}_t Et si on trouve une probabilité sous laquelle \widetilde{B}_t est un mouvement Brownien, Y sera une martingale.
D’après le théorème de Girsanov, il existe une probabilité, notée \mathbb{Q} et appelée probabilité risque neutre, de densité
\frac{d\mathbb{Q}}{d\mathbb{P}} = exp \left( -\frac{\mu -r}{\sigma}B_t -\frac{1}{2} \left(\frac{\mu -r}{\sigma}\right)^2t\right) par rapport à la probabilité historique \mathbb{P}, sous laquelle (\widetilde{B}_t = B_t + \frac{µ−r}{σ} t)_{t∈[0,T ]} est un mouvement brownien.
pour α = \frac{µ−r}{\sigma},
\frac{d\mathbb{Q}}{d\mathbb{P}} = e^{−αB_T − \frac{α^2}{2} T}
Pour t ∈[0, T ], on a \mathcal{F}_t = σ((\widetilde{B}_s)_{s∈[0,t]}). Notons que le prix actualisé de l’actif risqué Y_t, sous la probabilité \mathbb{Q}, vérifie
\begin{align*} dY_t &= σY_td\widetilde{B}_t \\ &= σY_t \left(\left( \frac{µ −σ}{ r} \right) dt + dB_t \right) \\ \end{align*}
Y_t =S_te^{−rt} = S_0e^{σ\widetilde{B}_t− \frac{σ^2}{2} t}
si bien que (Y_t)_{t∈[0,T ]} est une \mathbb{Q}-martingale. Donc sous la probabilité \mathbb{Q}, on a
dS_t = S_t( rdt + σd\widetilde{B}_t )
St = S_0 exp\left(σ\widetilde{B}_t + \left(r − \frac{1}{2}\sigma^2 \right) t\right) \tag{2} Dans ce rapport, sauf mention contraire, on se place sous la probabilité \mathbb{Q}, avec la notation simplifiée de l’espérance :^$ E := E^$.
3.3 Volatilité implicite (VI) de Black-Sholes
La volatilité implicite d’un prix d’option donné est la volatilité du modèle Black-Scholes associée à ce prix, c’est-à-dire que l’on veut trouver la volatilité σ telle que C_{BS}(t, S_t, K, T, σ) = C_{obs}(t, St, K, T ), où C_{BS} est le prix donné par le modèle Black-Scholes, C_{obs} est un prix observé sur le marché ou un prix simulé par un modèle donné. Dans la suite, ce prix pourrait être simulé par le modèle de Heston à l’aide de l’une des méthodes suivantes : Monte-Carlo, EDP, inversion de Fourier ou autre. Puisque le prix observé ne change pas à un instant fixe dans le temps, c’est une constante, donc l’équation devient C_{BS}(t, S_t, K, T, σ) − C = 0 où C ∈ R est une constante et la solution σ peut être trouvée en utilisant un algorithme itératif de recherche de racine. De plus, on peut remarquer que la formule de Black-Scholes (Équation 3) est bijective par rapport à σ.
3.4 Méthode de Monte-Carlo
Le modèle de Black-Scholes, étant un simple modèle de pricing, peut être utilisé pour déterminer le juste prix ou la valeur théorique d’un call ou d’un put. Cela peut se faire facilement avec la méthode de Monte-Carlo. On note X une variable aléatoire d’intérêt à valeurs dans \mathbb{R}^d et g une fonction de \mathbb{R}^d dans \mathbb{R}. Dans le cadre de l’estimation d’espérance, la méthode de Monte-Carlo s’utilise généralement lorsque la loi de X est connue mais E(g(X)) n’a pas de solution analytique ou bien lorsque la loi de X n’est pas explicite mais peut être simulée. On cherche alors à approcher E(g(X)) par Monte-Carlo pour un échantillon de variables indépendantes et identiquement distribuées (X_1, \dots , X_N) de X : on a alors E(g(X)) approché par
\frac{1}{N}\sum_{n=1}^{N} g(X_i)
Prenons l’exemple du calcul de prix d’un call, de payoff Ψ_{call}(S_T ) = (S_T − K)^+ =max(S_T −K, 0), avec K le prix d’exercice. On se donne une valeur initiale S_0 et les paramètres nécessaires (σ, T, r, K). Avec la formule (Équation 2), par la méthode de Monte-Carlo, on peut simuler des valeurs de S_T pour estimer l’espérance E[Ψ_{call}(S_T )]. On peut ensuite calculer le prix C_0 du call à l’instant t = 0, en fonction de S_0 : C_0(S_0) = e^{−rT} E[Ψ_{call}(S_T )|S_0] = e^{−rT} E[Ψ_{call}(S_T )]
3.5 Feynman-Kac EDP de Black-Scholes
Notons f le prix f(t, S_t) d’une option dépendante de S et de t. On note aussi que f(T, S_T ) = Ψ(S_T ) le payoff de l’option à la maturité T . D’après le lemme d’Itô et la constitution d’un portefeuille autofinancé, on arrive à l’équation aux dérivées partielles (EDP) de Black-Scholes : \frac{\partial f}{\partial t} + rS_t \frac{\partial f}{\partial S_t} + \frac{1}{2} \sigma^2 S_t^2 \frac{\partial^2 f_j}{\partial S_t^2} = rf, qui est aussi une EDP parabolique.
3.6 Formule du modèle Black-Scholes
Dans le cas d’une option d’achat de type européen qui confère à son acquéreur le droit, mais non l’obligation, d’acheter à l’échéance T une certaine quantité d’actif sous-jacent à un prix déterminé K , la valeur d’un call vaut : C_t = e^{-r(T-t)} \mathbb{E}_P \left[ \max(S_t - K, 0) | \mathcal{F}_t \right] où : \mathbb{E}_P [.] est l’espérance sous la mesure de probabilité historique et \mathcal{F}_t est la filtration naturelle du processus (S_t)_{t \in [0, T]}.
La dynamique de l’actif risqué S est donnée par l’équation : dS_t=S_t(μdt + σ dW_t) Où: - W = (W_t, t \geq 0) est un mouvement brownien, - \mu et \sigma sont des constantes, - \mu désigne le rendement instantané de S , - \sigma désigne l’écart type instantané de S ,
le prix d’une option d’achat européenne se calcule comme suit :
\begin{align*} C_t &= \mathbb{E}_P \left[e^{-r(T-t)} (S_t - K)^+ | \mathcal{F}_t \right] \\ &= e^{-r(T-t)} \mathbb{E}_P \left[ (S_t - K)\mathbb{1}_{ \{S_T \geq K \}} | \mathcal{F}_t \right] \text{puisque r n'est pas stochastique}, \\ &= e^{-r(T-t)} \mathbb{E}_P \left[ S_t \mathbb{1}_{ \{S_T \geq K \}} | \mathcal{F}_t \right] - e^{-r(T-t)} \mathbb{E}_P \left[K\mathbb{1}_{ \{S_T \geq K \}} | \mathcal{F}_t \right] \\ &= e^{-r(T-t)} \mathbb{E}_P \left[ S_t \mathbb{1}_{ \{S_T \geq K \}} | \mathcal{F}_t \right] - e^{-r(T-t)}K \mathbb{P}({ S_T \geq K) } \end{align*}
Le théorème de Girsanov nous permet d’écrire
\frac{dP}{dQ} = \frac{e^{-r(T-t)}S_T}{S_0 e^{-r0}} \Leftrightarrow dW_t = dW_t^* - \frac{\mu - r}{\sigma}dt
Et donc C_t =S_0 \ Q (S_T \geq K ) - e^{-r(T-t)}K \mathbb{P}({ S_T \geq K)^{II} }
D’où le résultat du prix d’un call :
C_t(S_t, K, r, T, σ) := f(t, St) = S_0 \mathcal{N}(d_1) − Ke^{−rT} \mathcal{N}(d_2) \tag{3} où
\mathcal{N}(z) = \frac{1}{\sqrt{2 \pi}} \int_{-\infty}^{z} e^{-u^2 / 2} du la fonction de répartition de la loi normale centrée réduite, et $$ \begin{align*} d_1 &= \frac{1}{\sigma \sqrt{T}} \left[ \ln \left( \frac{S_t}{K} \right) + (r + \frac{\sigma^2}{2} )(T - t) \right]\\ d_2 &= \frac{1}{\sigma \sqrt{T}} \left[ \ln \left( \frac{S_t}{K} \right) + (r - \frac{\sigma^2}{2})(T - t) \right]\\ \end{align*} $$ avec d_2 = d_1 - \sigma \sqrt{T - t}
3.7 Limitations du Modèle de Black-Scholes
Dans le monde de Black et Scholes, tous les paramètres sont supposés constants. Il est clair que ce n’est pas très réaliste, dans aucun marché. En fait, on pourra sans grande modification des modèles supposer les paramètres déterministes. Mais cela pose évidemment des problèmes d’identification (calibration) des paramètres importants.• En pratique : drift et volatilité non constantes
Mandelbrot (1963) avait déjà montré que les rendements des actifs financiers à un jour, ou une semaine n’étaient clairement pas statistiquement gaussiens, en particulier que la probabilité de grands mouvements de ces rendements était plus grande que celle que le monde gaussien quantifiait. Cette question “des queues épaisses” des distributions des rendements et de son implication dans la mesure des risques et la couverture des produits financiers est au coeur de la recherche actuelle
En pratique, on observe un smile/skew de volatilité : elle est non constante. En effet, la volatilité implicite aux options fortement hors de la monnaie ou largement dans la monnaie est plus élevée que la volatilité implicite recalculée à partir des options à la monnaie. On appelle ce phénomène “smile de volatilité” (le graphe de la volatilité en fonction du prix d’exercice est en forme de sourire). Pour un prix d’exercice donné, la différence entre la volatilité implicite observée et celle à la monnaie qui s’appelle le skew
La surface de volatilité d’un sous-jacent évolue également dans le temps. Les acteurs du marché la réévaluent sans cesse, modifiant leur anticipation de la probabilité, pour chaque prix d’exercice et maturité, qu’une option ne finisse dans la monnaie.• La volatilité en pratique n’est donc pas constante.
Volatilité implicite : Le modèle de Black-Scholes utilise une volatilité constante, alors que dans la réalité, la volatilité peut varier. Les traders utilisent souvent la volatilité implicite, dérivée des prix du marché des options, comme une meilleure estimation de la volatilité future.
Modèle unidimensionnel : Le modèle de Black-Scholes suppose un seul facteur de risque (le prix de l’actif sous-jacent), ce qui peut ne pas capturer toutes les sources de risque du marché, notamment les sauts de prix et les corrélations entre les actifs.
Limites d’applicabilité : Le modèle de Black-Scholes est mieux adapté aux options européennes sur des actifs sans dividendes, dans des marchés liquides et stables. Dans des conditions de marché extrêmes ou pour des options avec des caractéristiques spécifiques, le modèle peut ne pas être aussi précis.
Coûts de transaction et frictions du marché : Le modèle de Black-Scholes ne tient pas compte des coûts de transaction ni des autres frictions du marché, ce qui peut avoir un impact sur la valeur réelle des options dans la pratique.
3.8 conclusion
En conclusion, la connaissance de la volatilité joue un rôle essentiel dans l’évaluation et dans la couverture d’un investissement quelconque, surtout lorsque celui-ci est risqué. Par conséquent, la prévision de cette volatilité est indispensable afin de contrôler le risque (et lorsque possible, le diminuer)
4 Modèle de Heston
4.1 Introduction
Ce modèle représente une généralisation du modèle Black et Scholes du fait qu’il incorpore une volatilité qui varie avec le temps lors du calcul du prix de l’option. Ce modèle fournit une solution analytique (<<closed-form solution») pour calculer le prix d’une option d’achat ou de vente lorsqu’il y a une corrélation \rho entre le prix du sous-jacent et sa volatilité.
Il y a deux façons d’utiliser ce modèle, soit à travers la simulation de Monte Carlo du processus décrivant le prix de l’action, soit à travers une résolution analytique du prix de l’option qui exige l’évaluation d’intégrales complexes. Des expérimentations empiriques ont démontré que le modèle d ’Heston tient compte de l’asymétrie (skewness) et du coefficient d’aplatissement (Kurtosis) de la distribution des prix du sous-jacent et ajuste le prix des options en conséquence.
Le modèle de Steven L. Heston 1993, est aussi un modèle mathématique du marché. Il suppose que le cours de sous-jacent, S_t, suit un processus stochastique de type Black-Scholes, mais avec une variance (ou volatilité) stochastique v_t qui suit un processus de Cox, Ingersoll et Ross.
Présentation du modèle Sous la probabilité historique P, le modèle est représenté par le système bivarié d’équations différentielles stochastiques (EDS) :
Le processus qui décrit le prix du sous-jacent est identique à celui de Black et Scholes, à l’exception de la volatilité qui varie dans le temps. Ce processus est décrit par l’équation (Équation 4):
dS_t = \mu S dt + \sqrt{v(t)} S dW_t^1 \tag{4}
- S : prix de l’action sous-jacente
- \mu: taux de rendement espéré instantané (déterministe) de l’action (drift parameter)
- \sqrt{v(t)} : Volatilité du rendement de l’action
- W_t^1 : Le processus de Wiener, dont l’espérance est nulle et la variance égale à t.
La volatilité \sqrt{v(t)} suit le processus de diffusion de Omstein-Uhlenbeck:
d\sqrt{v(t)} = - \beta \sqrt{v(t)} dt + \delta dW_t^2 \tag{5}
où W_t^2 est un processus de Wiener qui a une corrélation \rho avec W_t^2, dW_t^1. dW_t^2 = \rho dt
En utilisant la première formule d’Itô, on obtient:
dv(t) = k[\theta - v(t) ]\ dt + \sigma\ \sqrt{v(t)} dz_2(t), \ \ \ v(t=0) = V_0 \tag{6}
\theta : la moyenne de la variance à long terme
k : un paramètre de retour à la moyenne
\sigma: la volatilité de la volatilité
V_0 est le carré de la volatilité initiale
Considérons: X_t= \sqrt{v(t)} = \int_{0}^{t} - \beta \sqrt{v(s)} \ ds \ + \ \int_{0}^{t} \delta dW_s
on a : f(X_t) = X_t^2 = v(t), \ \ \ f'(X_t) = 2 X_t, \ \ \ f''(X_t) = 2 écrivons v(t) comme processus d’Itô.
f(X_t) = f(X_0) + \int_{0}^{t} f'(X_s) \ dX_s \ + \ \frac{1}{2} \int_{0}^{t} f''(X_s) \ d \langle X\rangle _s
d \langle X_s\rangle = \delta^2 d \langle W_s\rangle = \delta^2 ds
$$
\begin{align*} f(X_t) = v(t) &= f(X_0) + \int_{0}^{t} f'(X_s) (- \beta \sqrt{v(s)} ds + \delta dW_s^2) \ + \ \frac{1}{2} \int_{0}^{t} f''(X_s) \ \delta^2 ds \\ dv(t) &= [f'(X_t)(- \beta \sqrt{v(t)}) \ + \ \frac{1}{2}f''(X_t) \ \delta^2] \ dt \ + f'(X_t) \delta dW_t^2 \\ &= [- 2 \beta v(t) \ + \delta^2] \ dt \ + 2 \sqrt{v(t)} \delta dW_t^2 \\ \end{align*} $$
Alors le lemme d’itô permet de montrer que le processus de diffusion de la variance v(t) s’écrit alors comme le montre l’équation (Équation 7)
dv(t) = [\delta^2 - 2 \beta\ v(t) ]\ dt + 2\delta \sqrt{v(t)} dz_2(t) \tag{7}
L’équation (Équation 7) peut donc se réécrire par identification sous la forme du processus de Cox, Ingersoll, et Ross (1985)
dv(t) = k[\theta - v(t) ]\ dt + \sigma\ \sqrt{v(t)} dz_2(t)
Dans le cas Black-Scholes, la seule source d’incertitude vient du prix du stock, qui peut se couvrir avec le stock. Dans le cas Heston, il faut aussi couvrir l’incertitude venant du caractére stochastique de la volatilité pour créer un portefeuille sans risque. Imaginons ainsi un portefeuille Π contenant l’option dont on cherche à détermner le prix noté V(S, v, t), la quantité −∆ de stock et la quantité −∆_1 d’un autre actif, de valeur V_1 dépendant de la volatilité. On a ainsi :
Π = V - ∆S - ∆_1V_1
Nous obtenons, grâce à la formule d’Itô :
\begin{align*} dΠ = \left\{ \frac{\partial V}{\partial t} + \frac{1}{2}vS^2(t)\frac{\partial^2 V}{\partial S^2} +\rho \sigma v S(t) \frac{\partial^2 V}{\partial S \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 V}{\partial v^2} \right\}dt \\ - ∆_1 \left\{ \frac{\partial V}{\partial t} + \frac{1}{2}vS^2(t)\frac{\partial^2 V}{\partial S^2} +\rho \sigma v S(t) \frac{\partial^2 V}{\partial S \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 V}{\partial v^2} \right\}dt \\ - \left\{ \frac{\partial V}{\partial S} - ∆_1 \frac{\partial V_1}{\partial S} - ∆ \right\}dS + \left\{ \frac{\partial V}{\partial v} - ∆_1 \frac{\partial V_1}{\partial v} \right\}dv \end{align*}
Pour que le portefeuille soit sans risque, il est nécessaire d’éliminer les termes en dS et dv,
\begin{align*} \begin{cases} \frac{\partial V}{\partial S} - ∆_1 \frac{\partial V_1}{\partial S} - ∆ = 0 \\ \frac{\partial V}{\partial v} - ∆_1 \frac{\partial V_1}{\partial v} = 0 \end{cases} \\ \end{align*}
d’où l’on tire les quantités :
\begin{align*} \begin{cases} ∆ = \frac{\partial V }{\partial S} - \frac{\partial V / \partial v}{\partial V_1 / \partial v} \frac{\partial V_1 }{\partial S} \\ ∆_1 = \frac{\partial V / \partial v}{\partial V_1 / \partial v} \end{cases} \\ \end{align*} \tag{8}
Le rendement d’un portefeuille sans risque devant être égal au taux sans risque r (supposé constant), sans quoi il y aurait une opportunité d’arbitrage, nous avons :
\begin{align*} dΠ = \left\{ \frac{\partial V}{\partial t} + \frac{1}{2}vS^2(t)\frac{\partial^2 V}{\partial S^2} +\rho \sigma v S(t) \frac{\partial^2 V}{\partial S \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 V}{\partial v^2} \right\}dt \\ - ∆_1 \left\{ \frac{\partial V}{\partial t} + \frac{1}{2}vS^2(t)\frac{\partial^2 V}{\partial S^2} +\rho \sigma v S(t) \frac{\partial^2 V}{\partial S \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 V}{\partial v^2} \right\}dt \\ \end{align*}
\begin{align*} dΠ &= rΠdt \ \ \ \text{car les termes } \ dS \ \text{et} \ dv \ \text{ ne sont plus} \\ &= r(V - ∆S - ∆_1V_1)dt \end{align*}
En utilisant (Équation 8), la dernière équation peut se réécrire :
\begin{align*} \frac{1}{\partial V / \partial v} \left\{ \frac{\partial V}{\partial t} + \frac{1}{2}vS^2(t)\frac{\partial^2 V}{\partial S^2} +\rho \sigma v S(t) \frac{\partial^2 V}{\partial S \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 V}{\partial v^2} + rS \frac{\partial V}{\partial S} -rV \right\}dt = \\ \frac{1}{\partial V_1 / \partial v} \left\{ \frac{\partial V}{\partial t} + \frac{1}{2}vS^2(t)\frac{\partial^2 V}{\partial S^2} +\rho \sigma v S(t) \frac{\partial^2 V}{\partial S \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 V}{\partial v^2} + rS \frac{\partial V_1}{\partial S} -rV_1 \right\}dt \end{align*}
Le membre de gauche est une fonction uniquement de V tandis que le membre de droite est une fonction de V_1 seulement. Cela force chacun des deux membres à être égaux à une fonction f des variables indépendantes S, v et t. On peut ainsi écrire que :
\begin{align*} \frac{\partial V}{\partial t} + \frac{1}{2}vS^2(t)\frac{\partial^2 V}{\partial S^2} +\rho \sigma v S(t) \frac{\partial^2 V}{\partial S \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 V}{\partial v^2} + rS \frac{\partial V}{\partial S} -rV = \\ \frac{\partial V}{\partial v}f \end{align*}
Soit encore:
\begin{align*} \frac{\partial V}{\partial t} + \frac{1}{2}vS^2(t)\frac{\partial^2 V}{\partial S^2} +\rho \sigma v S(t) \frac{\partial^2 V}{\partial S \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 V}{\partial v^2} + rS \frac{\partial V}{\partial S} -rV = \\ \frac{\partial V}{\partial v} \left[ κ(θ − v) − Λ(S, v, t)σ \sqrt{v} \right] \end{align*}
où Λ(S, v, t) est le prix de marché de la volatilité. Dans son article, Heston choisit Λ(S, v, t) = \frac{\lambda(S, v, t)\sqrt{v}}{σ}, de sorte que :
\frac{\partial V}{\partial t} + \frac{1}{2}vS^2(t)\frac{\partial^2 V}{\partial S^2} +\rho \sigma v S(t) \frac{\partial^2 V}{\partial S \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 V}{\partial v^2} \\ + rS \frac{\partial V}{\partial S} -rV - \frac{\partial V}{\partial v} \left[ κ(θ − v) − \lambda(S, v, t) v \right] = 0 \tag{9}
Donc la valeur de tout actif V(S, v, t) doit satisfaire l’equation(Équation 9).
4.2 Expression analytiques des call et Putt
paramètres | équation |
---|---|
g | Équation 14 |
d | Équation 15 |
C | Équation 12 |
D | Équation 13 |
f | Équation 15 |
P_1 | Équation 16 |
P_1 | Équation 16 |
prix du call | Équation 10 |
la relation de parité put-call dans le modèle de Heston est donnée par : C - P = S_0 - Ke^{-rT}
On cherche à présent à résoudre (Équation 9) pour un call européen de strike K, nous retrouverons le prix du Put par la relation de parité. Par analogie avec la formule de Black-Scholes, on suppose que la solution cherchée peut s’écrire sous la forme:
C(S,v,t) = SP_1 - KP(t, T)P_2 \tag{10} Posons x = ln(S) et τ = T − t.
En injectant (Équation 10) dans (Équation 9), on obtient pour j = 1; 2 : \frac{\partial P_j}{\partial t} + \frac{1}{2}v\frac{\partial^2 P_j}{\partial x^2} +\rho \sigma v \frac{\partial^2 P_j}{\partial x \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 P_j}{\partial v^2} + (r+u_jv) \frac{\partial P_j}{\partial x} - ( a − b_j v ) \frac{\partial P_j}{\partial v} = 0 où u_1 = \frac{1}{2}, u_2 = - \frac{1}{2}, a = κθ, b_1 = κ + λ − ρσ, b_2 = κ + λ
D’autre part, puisqu’il s’agit d’un call, nous avons les conditions à la limite suivante : P_j(x, v, T ) = \mathbb{1}_{ \{x \geq ln(K) \}}
dx(t)= [r + u_jv]dt +\sqrt{v(t)}dW_t^1, \\ dv = (a_j - b_jv)dt + \sigma \sqrt{v(t)}dW_t^2
où les paramètres u_j, a_j et b_j sont définis comme avant,
alors les P_j peuvent s’interpréter comme des probabiltés conditionnelle que l’option expire dans la monnaie: P_j(x, v, T, ln(K) ) = \mathbb{P}[x(T) \geq ln(K) \ | \ x(t) = x, v(t) = v ]
Les probabilités ne sont pas immédiatement disponibles sous forme fermée. Cependant,les fonctions caractéristiques correspondantes f_1 et f_2 satisfont l’EDP (Équation 9) : \frac{\partial f_j}{\partial t} + \frac{1}{2}v\frac{\partial^2 f_j}{\partial x^2} +\rho \sigma v \frac{\partial^2 f_j}{\partial x \partial v} + \frac{1}{2} \sigma^2 v \frac{\partial^2 f_j}{\partial v^2} + (r+u_jv) \frac{\partial f_j}{\partial x} - ( a − b_j v ) \frac{\partial f_j}{\partial v} = 0 \tag{11}
avec la condition terminale f_j(x, v, T, Φ) = e^{iΦx} Nous allons chercher une solution sous la forme : f_j(x, v, t, Φ) = exp \left(C(τ; Φ) + D(τ; Φ)v + i\phi x \right) En injectant dans (Équation 11), on obtient :
\begin{align*} - \frac{Φ^2}{2} + ρσΦiD + \frac{1}{2} σ^2D^2 + u_jΦi − b_jD +\frac{\partial D}{\partial t} &= 0 \\ rΦi + aD +\frac{\partial C}{\partial t} &= 0 \end{align*} avec C(0, Φ) = D(0, Φ) = 0. On peut résoudre ces ODE :
C(τ, Φ) = rΦiτ + \frac{a}{σ^2} \left[(b_j − ρσΦi + d)τ − 2ln\left( \frac{1−ge^{dτ}}{ 1−g} \right) \right] \\ \tag{12}
D(τ, Φ) = \frac{ b_j − ρσΦi + d}{σ^2}\left[ \frac{1−e^{dτ}}{1−ge^{dτ}} \right] \tag{13} avec
g = \frac{bj − ρσΦi + d}{bj − ρσΦi − d} \text{et} \\ \tag{14} et
d = \sqrt{q(ρσΦi − b_j)^2 − σ^2(2u_jΦi − Φ^2} ) \tag{15} Par transformation inverse, on arrive à obtenir (cf [5] ) :
P_j = \frac{1}{2} + \frac{1}{\pi} \int_0^{+\infty} Re \left[ \frac{e^{−iΦln(K)}f_j}{iΦ} \right] dΦ \tag{16}
4.3 Effets de la volatilité stochastique
Effects of the stochastic volatility Model options prices This section delves into the intricate dynamics of option pricing under stochastic volatility, contrasting it with the traditional Black-Scholes model. It elucidates how variations in volatility over time impact option prices, noting that higher variance generally elevates option prices. Unlike the Black-Scholes model, where volatility is constant, the stochastic volatility model incorporates a process where variance drifts toward a long-run mean, introducing mean reversion dynamics. This mean reversion mechanism influences option prices, with higher average variance leading to increased option prices. However, the section underscores the nuanced relationship between implied and true variance, attributing disparities to the risk premium associated with volatility changes. It also discusses the role of parameters such as correlation and volatility of volatility, illustrating how they shape the skewness and kurtosis of spot returns, thereby affecting option prices.
Furthermore, the section highlights the stochastic volatility model’s ability to capture a diverse range of pricing effects compared to the Black-Scholes model. By properly selecting parameters such as the correlation of volatility with spot returns and the volatility of volatility, the model offers insights into the intricacies of option pricing. Notably, it emphasizes the distinction between the effects of stochastic volatility per se and the correlation of volatility with spot returns, highlighting their respective impacts on skewness and kurtosis. Ultimately, the section underscores the importance of carefully choosing model parameters to accurately reflect market dynamics and offers a more nuanced perspective on option pricing compared to the simplistic assumptions of the Black-Scholes framework.
(( image 2 , 3 et 4)
In conclusion, this paper introduces a comprehensive solution for options on assets exhibiting stochastic volatility, applicable across various financial instruments such as stocks, bonds, and currencies. The model’s versatility allows it to capture a wide range of biases in option prices, with a clear linkage to the dynamics of spot prices and the distribution of spot returns. By characterizing option models based on the first four moments of spot returns under risk-neutral probabilities, it becomes evident that the Black-Scholes model emphasizes the impact of variance while disregarding mean spot returns. However, the stochastic volatility model accounts for skewness and kurtosis, showcasing its flexibility and promise in accurately describing option prices. Notably, the model’s ability to explain various option phenomena, such as changing biases over time and discrepancies between implied and future volatilities, presents opportunities for further empirical exploration and refinement.
Moreover, the stochastic volatility model offers testable restrictions that relate option pricing biases to spot price dynamics and spot return distributions. Its successful application in explaining currency option prices and its potential to elucidate other option phenomena highlight its significance in financial modeling. By providing a framework to investigate puzzles in option pricing and explore additional features, such as changing biases and implied volatility anomalies, the model opens avenues for deeper insights into market dynamics. Furthermore, the solution technique employed in this model transcends stochastic volatility problems and diffusion processes, offering broader applicability across diverse financial modeling domains. Overall, the stochastic volatility model stands as a promising tool for understanding and analyzing option pricing with implications extending beyond the realm of finance.
4.4 Greeks
4.4.1 Delta :
Le delta, un paramètre clé dans l’évaluation des options, mesure la sensibilité du prix de l’option aux fluctuations du prix de l’actif sous-jacent. Il permet aux investisseurs d’anticiper l’impact des variations du marché sur la valeur de leurs options, en indiquant la probabilité que l’option soit exercée en fonction des mouvements de l’actif sous-jacent. Avec un rôle essentiel dans la gestion des risques et la construction de portefeuille, un delta élevé signale une exposition plus importante aux fluctuations du marché, tandis qu’un delta plus faible offre une certaine protection contre les mouvements défavorables, permettant aux investisseurs d’adapter leurs stratégies en fonction de leurs objectifs et de leur tolérance au risque.
4.4.2 Vega :
Le vega, un paramètre clé dans l’évaluation des options financières, représente la sensibilité du prix d’une option aux variations de la volatilité implicite du marché. Cette mesure joue un rôle crucial dans la gestion des risques et la prise de décision des investisseurs, car elle permet d’évaluer l’impact des changements de volatilité sur la valeur des options. Un vega élevé indique une forte sensibilité aux variations de la volatilité, ce qui peut être favorable pour les investisseurs souhaitant profiter des fluctuations du marché. En revanche, un vega faible peut signaler une moindre exposition aux changements de volatilité, offrant ainsi une certaine stabilité dans des conditions de marché plus calmes. Ainsi, la compréhension du vega est essentielle pour élaborer des stratégies d’options efficaces et gérer de manière proactive les risques associés aux variations de volatilité sur les marchés financiers.
4.4.3 Gamma :
Le gamma, un autre “Grec” fondamental dans le domaine des options, est une mesure de la sensibilité du delta d’une option aux variations du prix de l’actif sous-jacent. En d’autres termes, le gamma mesure la variation du delta de l’option en réponse à un mouvement unitaire du prix de l’actif sous-jacent. Cette mesure est cruciale pour les investisseurs car elle offre un aperçu de la façon dont la sensibilité de l’option aux fluctuations du marché évolue à mesure que le prix de l’actif sous-jacent change. Un gamma élevé indique une sensibilité accrue du delta aux variations du prix de l’actif sous-jacent, ce qui signifie que de petits changements de prix peuvent entraîner des ajustements significatifs du delta et donc du risque associé à l’option. En revanche, un gamma plus faible indique une sensibilité moindre du delta aux fluctuations du prix de l’actif sous-jacent, offrant ainsi une certaine stabilité dans la gestion du risque pour les investisseurs. Ainsi, comprendre le gamma est essentiel pour évaluer et gérer efficacement les risques associés aux options et pour élaborer des stratégies d’investissement adaptées aux différentes conditions de marché.
4.4.4 Le “rho” (ρ)
Le rho est une mesure de la sensibilité du prix d’une option aux variations des taux d’intérêt sans risque. Plus précisément, le rho mesure le changement théorique du prix de l’option pour une variation d’un point de pourcentage des taux d’intérêt sans risque. Cette mesure est particulièrement importante dans les environnements de marché où les taux d’intérêt jouent un rôle significatif, car elle permet aux investisseurs d’évaluer l’impact des variations des taux d’intérêt sur la valeur de leurs options. Un rho positif indique que le prix de l’option augmente lorsque les taux d’intérêt augmentent, tandis qu’un rho négatif indique une relation inverse, où le prix de l’option diminue lorsque les taux d’intérêt augmentent. Ainsi, le rho est un outil essentiel pour les investisseurs dans la gestion des risques et la prise de décision en matière d’options, car il leur permet d’anticiper l’impact des fluctuations des taux d’intérêt sur la valeur de leurs positions d’options et d’adapter leurs stratégies en conséquence.
4.5 Estimation des paramètres et calibration
En finance, la calibration d’un modèle financier joue un rôle important pour la gestion des risques et pour les produits dérivés, et nécessite d’être effectuée rapidement et avec précision.
Le modèle de Heston nous donne la prime d’une option d’échéance T et de strike K à partir des paramètres p = ( κ, θ, σ, ρ). Or jusqu’à présent nous avons considéré ces paramètres comme des données propres au marché et on doit donc s’interroger sur leur valeur. Pour simuler la volatilité , il faut estimer tout d’abord les paramètres du modèle, soit \kappa (kappa), \theta(thêta), \sigma (sigma), et \rho (rho). C’est-à-dire calibrer ces paramètres aux données du marché. Une façon de faire consiste à résoudre le problème de minimisation :
p = arg \operatorname*{inf}_{p \in \mathbb{R^5}} \sum_{n=1}^{m} α_i (H(X_i, p) − C_i)^2 où H_i et C_i sont respectivement le prix simulé par le modèle de Heston et le prix observé sur le marché d’une option i dont les caractéristiques (telles que le strike K_i ou l’échéance T_i) sont pris en compte par le vecteur X_i.
p = arg \operatorname*{inf}_{p \in \mathbb{R^5}} \sum_{n=1}^{m} \omega_i (\sigma_H(X_i, p) − \sigma_{C_i})^2
où σ_{H_i} et \sigma_{C_i} sont respectivement la volatilité implicite du prix simulé par le modèle de Heston et la volatilité implicite du prix observé sur le marché d’une option i dont les caractéristiques (telles que le strike K_i ou l’échéance T_i) sont pris en compte par le vecteur X_i.
Les poids \omega_i permettent d’accorder plus d’importance à certaines options qu’à d’autres. En choisissant comme poids le véga de l’option, à savoir sa sensibilité à la volatilité, on favorise les options ayant un véga élevé car, sur ces options là, une faible variation de volatilité induit une variation plus importante de prix dont il faut se prémunir.
4.5.1 Error Loss Functions
L’estimation des paramètres se fait en minimisant l’écart entre les prix des options générés par le modèle et les prix observés sur le marché. Trois formes de fonctions « Error Loss Functions» seront utilisées pour estimer les paramètres du modèle. Ces méthodes sont cohérentes avec les prix des options car elles fournissent des paramètres estimés qui, lorsque utilisés dans le modèle, génèrent des prix d’options très proches de ceux observés sur le marché.
La méthode $RMSE
La méthode RMSE ou « root mean squared error loss function » donne la racine carrée de la moyenne des carrés des termes d’erreur e_i(\Theta)( i = 1,...,N) :
RMSE(\Theta) = \sqrt{ \frac{1}{N}\sum_{n=1}^{N} e_i^2(\Theta) }
où e_i(\Theta)=C_i - C_i(\Theta) sont les termes d’erreur
- N est le nombre de prix d’options qui existent sur le marché
- C_i sont les prix des N options sur le marché
- C_i(\Theta) sont les prix de ces N options calculés à partir du modèle (Heston dans notre cas), et qui dépendent sur un ensemble de paramètres \Theta . La méthode $RMSE accorde plus de poids aux options en jeu car ces dernières sont plus chères. Ce qui fait que l’écart d’erreur entre le prix du marché et celui du modèle va être plus grand et par conséquent, les paramètres estimés vont induire de petites erreurs pour les prix des options en jeu.
La méthode %RMSE
La méthode \% RMSE ou « relative root mean squared en’or loss function » minimise l’écart relatif (%) de la racine carrée de la moyenne des carrés des termes d’erreur e_i(\Theta)( i = 1,...,N) :
\% RMSE(\Theta) = \sqrt{ \frac{1}{N}\sum_{n=1}^{N} \left( \frac{e_i(\Theta)}{C_i} \right)^2 }
La méthode %RMSE, de son côté, assigne plus de poids aux options fortement hors jeu car ces options ont des prix relativement faibles. Or dans la formule, ces prix se retrouvent au dénominateur, donc le terme d’erreur est amplifé pour ce type d’options.
La méthode ivRMSE
Cette méthode « implied volatility root mean squared error loss function » minimise l’écart entre les volatilités implicites des prix des options observées sur le marché et celles obtenues des prix donnés par le modèle (de Heston dans notre cas).
iv RMSE(\Theta) = \sqrt{ \frac{1}{N}\sum_{n=1}^{N} \left( \sigma_i - \sigma_i(\Theta) \right)^2 }
où
\sigma_i est la volatilité implicite de Black et Scholes obtenue avec C_{mkt} = C_{BS}(c_{iv}, K, T)
\sigma_i(\Theta)) est la volatilité implicite de Black et Scholes obtenue avec C_{heston} =C_{BS}(c_{iv}, K, T)
La méthode ivRMSE, elle accorde des poids équivalents à tous les types d’options. Ceci revient à ce que cette méthode cherche à minimiser l’écart d’erreur entre les volatilités implicites observées sur le marché et les volatilités implicites obtenues à partir des prix générés par le modèle, soit celui de Heston (1993) dans notre cas.
4.5.2 Optimisation
Cette étape est cruciale puisque c’est à partir de ces paramètres que nous pourrons effectivement pricer et couvrir des options.
La méthode d’optimisation la plus appropiée est l’algorithme de Levenberg-Marquardt.
L’algorithme de Levenberg-Marquardt est une méthode d’optimisation utilisée pour résoudre des problèmes de moindres carrés non linéaires. Dans le contexte de la calibration des paramètres du modèle de Heston, l’objectif est de minimiser les résidus (la différence entre les prix des options observés sur le marché et les prix théoriques calculés à partir du modèle de Heston).
Nous décrivons ici le cadre général de la méthode. Etant donné un certain nombre de paires de données (t_i; y_i), on cherche le paramètre p (qui peut être un vecteur) de la fonction f(t; p) qui minimise la somme des carrés des déviations :
S(p) = \sum_{n=1}^{m} \left[ y_i - f(t_i,p) \right]^2
que l’on notera sous forme d’une erreur quadratique moyenne :
S(p) = \langle \left( f(t,p) - y \right)^2 \rangle Dans la suite, on se place dans le cas où f est une fonction scalaire pour simplifier les notations. L’algorithme consiste à interpoler l’algorithme de Gauss-Newton et la méthode de descente de gradient. L’algorithme est plus stable que le premier, c’est-à-dire qu’il trouve une solution même s’il est démarré loin du minimum. Cependant, pour certaines fonctions très régulières, il peut converger légèrement moins vite. Les deux sections qui suivent seront consacrées à la présentation des algorithmes de Gauss-Newton et de descente de gradient. Puis, l’algorithme de Levenberg-Marquardt sera décrit.
L’algorithme de Gauss-Newton
Dans cette section, on cherche à minimiser la fonction S(p) par l’algorithme de GaussNewton. Supposons qu’on se trouve à l’itération n (le vecteur p_{n−1} est connu) de l’algorithme et que l’on cherche à calculer le vecteur p_n en fonction de p_{n−1} tel que S(p_n) se rapproche plus d’un minimum local de S. Pour cela, on calcule une approximation quadratique de S à partir d’un approximation linéaire de f autour de p_{n−1} :
f(t, p) = f(t, p_{n−1}) + \nabla f(t, p_{n−1}).p \ + \dots
Il est important de noter que le gradient \nabla f(t, p_{n−1}) est calculé uniquement à partir des composantes du vecteur p. En remplaçant (1.1) dans (0.1), et en déterminant le point pn où le gradient de S s’annule, on obtient :
p_n = p_{n−1} − H^{−1}.d \tag{17}
où d = \langle (f(t, p_{n−1}) − y)(\nabla f(t, p_{n−1})) \rangle \\ H = \langle (\nabla f(t, p_{n−1}))(\nabla f(t, p_{n−1})^T) \rangle
à condition que H soit inversible. La matrice H est une approximation de la hessienne de S au point p_{n−1} calculée à partir du gradient de f. Cet algorithme de Gauss-Newton ne donne en pratique de bons résulats que si f est effectivement proche d’une fonction affine au point p_{n−1}, sinon, cet algorithme donne de très mauvais résultats.
4.5.3 L’algorithme de descente de gradient
Dans cette section, on cherche à minimiser la fonction S(p) par l’algorithme de descente de gradient. On suppose là encore qu’on se trouve à l’itération n et que l’on cherche à calculer le vecteur p_n en fonction de p_{n−1} tel que S(p_n) se rapproche d’un minimum local de S. L’idée de la descente de gradient est de suivre la direction opposée au gradient de S au point p_{n−1} : p_n = p_{n−1} − \theta_{n−1} \nabla S(p_{n−1}) La longeur du pas \theta_{n−1} peut être choisie de diférentes manières. Dans une descente de gradient à pas constant, θ_n est constante et sa valeur est fixée au début de l’algorithme. Une autre façon est de prendre pour (θ_n)_{n≥1} une suite décroissante. - par exemple θ_n = \frac{α}{ n} . Enfin, θ_{n−1} peut être choisie de sorte à minimiser S le long de la droite vectorielle dirigée par le gradient \nabla S(p_{n−1}). Ainsi, θ_{n−1} = \operatorname*{argmin}_{θ} S \left(p_{n−1} − θ\nabla S(p_{n−1})\right)
4.5.4 L’algorithme de Levenberg-Marquardt
Cet algorithme fut découvert par Kenneth Levenberg et amélioré par Donald Marquardt. L’idée est d’utiliser un algorithme de Gauss-Newton dans les zones où S et quasi-quadratique (i.e. f est quasi-linéaire) et une descente de gradient dans les autres cas. Le pas d’une itération de cet algorithme est calculé de la façon suivante :
p_n = p_{n−1} − (H + \lambda I)^{−1}.d
Lorsque λ est petit, cette équation est équivalente à (Équation 17) et le nouveau vecteur p_n est déterminé à partir d’une approximation quadratique de S. Lorsque λ est grand, cette équation est équivalente à : $$ \begin{align*} p_n &= p_{n−1} − \frac{1}{\lambda}d \\ &= p_{n−1} − \frac{1}{\lambda} \langle (f(t, p_{n−1}) − y)(\nabla f(t, p_{n−1})) \rangle \\ &= p_{n−1} − \frac{1}{\lambda} \nabla S(t, p_{n−1}) \end{align*} $$
Ce qui correspond bien à une descente de gradient. Pour des valeurs intermédiaires de λ l’algorithme est un mélange entre la descente de gradient et l’approche quadratique basée sur l’approximation linéaire de f. Ce coefficient est modifié à chaque itération, comme pour la descente de gradient adaptative. Si S(p_n) diminue au cours de l’itération, on diminue λ (en le divisant par 10 par exemple), et l’on se rapproche ainsi de la méthode quadratique. Au contraire si S(p_n) augmente, cela signifie que nous nous trouvons dans une région dans laquelle S n’est pas très quadratique, et donc on augmente λ (en le multipliant par 10 par exemple) afin de se rapprocher de la descente de gradient. Cet algorithme fut ensuite amélioré par Marquardt, le pas de l’itération étant cette fois-ci défini par : p_n = p_{n−1} − (H + \lambda diag(H))^{−1}.d La matrice identité a été remplacée par la diagonale de H. Le but est ici de modifier le comportement de l’algorithme dans les cas où λ est grand, c’est à dire lorsque l’on est proche d’une descente de gradient. Avec cette modification l’on se déplace plus vite dans les directions vers lesquelles le gradient est plus fiable, afin d’éviter de passer de nombreuses itérations sur un plateau. Ceci est appelé l’algorithme de Levenberg-Marquardt. En pratique, cet algorithme permet de converger avec beaucoup moins d’itérations. Mais chaque itération demande plus de calculs, en particulier pour l’inversion de la matrice H. Son utilisation se limite donc aux cas où le nombre de paramètres à optimiser n’est pas très élevé. En effet, si p est un vecteur de dimension N, H est une matrice N × N, et le nombre d’opérations nécessaires à l’inversion d’une matrice N × N est proportionnel à N^3.
l’algorithme de Levenberg-Marquardt :
Initialisation : Commencer avec une estimation initiale des paramètres du modèle de Heston.
Calcul des résidus : Calculer les résidus entre les prix des options observés et les prix théoriques calculés à partir du modèle de Heston.
Calcul de la matrice Jacobienne : Calculer la matrice Jacobienne, qui représente les dérivées partielles des résidus par rapport aux paramètres du modèle. Cela peut être fait numériquement en utilisant des différences finies ou analytiquement si possible.
Calcul de la direction de descente : Utiliser la méthode de Gauss-Newton pour calculer une direction de descente initiale. Cette direction est obtenue en résolvant un système linéaire approximatif.
Calcul de la mise à jour : Utiliser la méthode de Levenberg-Marquardt pour mettre à jour les paramètres du modèle. Cela implique de résoudre un système linéaire régularisé.
Mise à jour des paramètres : Mettre à jour les paramètres du modèle en utilisant la direction de descente calculée à l’étape précédente.
Vérification de convergence : Vérifier si les critères de convergence sont satisfaits. Si ce n’est pas le cas, répéter les étapes 2 à 6.
Terminaison : Arrêter l’algorithme lorsque les critères de convergence sont satisfaits ou lorsque le nombre maximal d’itérations est atteint.
4.6 Les données utilisées lors des calculs
Les données utilisées 10 pour les calculs sont les prix des cali et des put écrits sur l’indice S&P500 échéant le troisième vendredi du mois d’échéance et qui étaient disponibles sur le marché. Nous ne considérons que les options du SPX transigées lors de la plus récente journée de chaque année de 2000 à 2007 et dont les volumes étaient les plus élevés. Le tableau 2.1 ci-dessous montre un sous ensemble des options utilisées pour estimer les paramètres du modèle de Heston (l993) pour l’année 2007.
La commande setClass() est utilisée pour créer la classe S4. La fonction new() permet de créer un objet de la classe S4.
4.6.1 Implémentation en R
Le point de vue que nous adoptons dans cette partie est celui d’un analyste quantitatif d’une
banque travaillant sur des options Call et Putt sur sous-jacents simples, une action ou un indice. Son objectif est de pouvoir fournir à ses collègues, les structurers et les traders, un moyen de calculer les primes des options vendues par sa banque. Ce travail est d’une importance cruciale puisque le prix doit être le plus « juste » possible, c’est celui-ci qui conditionnera la prospérité de la banque pour laquelle il travaille. Le quant doit aussi indiquer au trader la façon optimale de couvrir l’option, c’est-à-dire déterminer la composition et la bonne gestion du portefeuille qui permettra au trader de gérer le risque pris par la banque suite à la
vente de l’option. Enfin, il doit mettre en place l’outil informatique qu’utiliseront ses collègues
pour obtenir facilement le prix des options qu’ils souhaitent vendre. Les deux premières étapes
de modélisation et de pricing ont été exposées dans la 1re partie de ce projet. La modélisation
fait intervenir les paramètres ρ; κ; θ; v0 et σ, ces données sont propres au marché sur lequel le
sous-jacent est coté. Il convient donc de les calibrer. Le principe de cette étape a été exposé dans
la 2e partie. L’objet de cette nouvelle partie est d’exposer comment l’analyste quantitatif peut
structurer son projet informatique de calibration et de pricing sous les contraintes suivantes :
– précision,
– rapidité,
– facilité d’utilisation
4.6.2 Structures
A l’ouverture des marchés, pour calibrer le modèle, le quant dispose des prix des call sur le sous-jacent qui l’intéresse avec des strike et des échéances différentes. Le quant doit pouvoir rapidement calibrer le modèle de Heston. Pour ce faire, nous avons implémenté deux classes principales, la classe Option, dont dérivent d’autres classes, et la classe Optimisation. Le principal avantage de la programmation Objet en R est l’utilisation des héritages, qui permet de rajouter facilement des raffinements. Dans notre projet, à la classe Option, nous avons fait dériver la classe Heston (qui implémente le modèle de Heston) et la classe Black-Scholes (qui implémente le modèle de Black-Scholes)
La classe Option
La classe Option comprend l’ensemble des données du marché indispensables à l’évaluation de l’option quel que soit le modèle utilisé. Cette classe est virtuelle, ses caractéristiques sont résumés dans le tableau suivant :
paramètres de la Classe Option | description |
---|---|
character type | Nature de l’option : call , Put |
double t0 | Date de l’évaluation de l’option |
double T | Date de maturité de l’option |
double S0 | Prix spot à t0 |
double K | Prix d’exercice de l’option |
double r | Taux d’intérêt sans risque continu |
double d | Taux de dividende continu |
double market_price | Prix réel de l’option sur le marché |
double vega | Vega=@prix @σoption de l’option réel en t0 sur le marché |
virtual double prix()=0 | Fonction membre virtuelle |
A cette description, il faut bien sûr ajouter qu’il existe deux constructeurs :
– le constructeur par défaut,
– un constructeur qui initialise les paramètres à la création de la nouvelle instance.
Cette classe n’est pas utilisable en tant que telle, c’est une classe mère à partir de laquelle nous
avons défini des classes filles correspondant chacune à un type de modèle. Ainsi, nous avons introduit la classe BS pour le modèle de Black-Scholes et la classe Heston pour le modèle d’Heston
selon le schéma suivant :
La classe BS
Cette classe dérive de la classe Option et qu’elle hérite aussi de tous ses paramètres. A ceux-ci, pour pouvoir implémenter le prix de l’option selon le modèle de Black-Scholes, il faut ajouter le paramètre volatilité implicite, σ. L’implémentation de cette classe nous permet aisément de comparer l’effet du changement de modèle sur les prix.
La classe Heston
Cette classe est de la forme class Heston :public Option. Le tableau suivant énumère les caractéristiques de cette classe :
paramètres de la Classe Heston | description |
---|---|
double rho | Corrélation des browniens |
double kappa | Vitesse de retour à la moyenne |
double sigma | Volatilité de la volatilité |
double theta | Variance à l’infini |
double v0 | Variance initiale |
double prix() | Méthode qui renvoie le prix de l’option |
Ainsi, en tapant seulement les deux lignes suivantes :
Heston
show
h(phi, S0, K, T, t0, r, d, w, rho, kappa, sigma, theta, v0, market_price)
price()
on obtient le prix de l’option donné par le modèle de Bates. L’implémentation des classes constitue une étape fondamentale dans l’implémentation de la calibration. La deuxième étape est l’implémentation du module d’optimisation.
4.6.3 Influence qualitative des paramètres sur le smile
Dans cette sous-section, nous cherchons à déterminer l’influence d’un paramètre sur l’allure du smile de volatilité, tous les autres paramètres étant fixés. Nous nous intéressons aux volatilités implicites et plutôt qu’aux prix car elles sont toutes comparables les unes aux autres. Nous avons fixés dans tous les graphiques de cette sous-section les paramètres suivants (sauf lorsque l’on étudie le paramètre en question) :
4.7 L’approche de résolution analytique
Cette approche est une simulation Monte Carlo. Un grand nombre de trajectoires du prix de l’action est généré durant la vie de l’option selon le processus stochastique de St. Pour chaque trajectoire de prix, la valeur terminale de l’option est actualisée au taux sûr jusqu’au temps zéro. Ceci donne le prix de l’option pour une trajectoire. Ce processus est répété plusieurs fois et le prix de l’option sera évalué comme la moyenne des prix de l’option actualisés sur chaque trajectoire. 2.1.2 L’approche de résolution analytique Cette méthode est plus rapide que la précédente puisque l’on n’a pas à25 générer des trajectoires de prix. Cependant elle est plus difficile à implanter car elle requiert l’évaluation d’intégrales complexes lors du calcul des probabilités risque neutres PI et P2. Cette approche requiert de connaître le pnx spot St de l’action, le pnx d’exercice K, le temps jusqu’à échéance T = T - t, et le taux sans risque r. Elle requiert également d’estimer les paramètres du processus tels que la variance à long terme 8, la variance courante v, le prix du risque de la volatilité À, le paramètre de retour à la moyenne K, la volatilité de la variance 0”, et le facteur de corrélation p entre le processus décrivant le prix de l’action et celui de sa volatilité. Dans ce cas, la faiblesse du modèle de Heston (1993) provient de la nécessité d’une intégration numérique et les prix de l’option seront très sensibles à la dimension de l’intervalle d’intégration. Il y a deux paramètres qui attirent particulièrement l’attention: a) Le coefficient de corrélation entre le prix de l’action et sa volatilité, soit p. Une valeur négative de p induit une asymétrie négative dans la distribution des prix de l’action. En effet, l’asymétrie positive ou négative affecte les prix des options. Quand les prix du titre présentent une asymétrie négative, la probabilité de réaliser de grandes pertes est plus importante que celle prédite par le modèle Black&Scholes. Le modèle de Heston est capable de détecter l’asymétrie de la distribution et d’ajuster le prix du cali en conséquence. b) La volatilité de la variance 0” qui affecte le prix du calI. Le cas le plus simple est celui pour lequel 0” = 0, ce qui correspond à une variance déterministe dans le processus décrivant la volatilité de l’action. La volatilité de la variance contrôle le coefficient d’aplatissement ou « kurtosis » de la distribution des rendements: une plus grande volatilité de la variance augmente le kurtosis de la distribution tandis qu’une plus petite volatilité le fait diminuer. En comparant le modèle de Heston à celui de Black et Scholes, on remarque que le modèle de Heston accorde des prix inférieurs au call qui est à parité mais26 des prix plus élevés pour les call en jeu ou hors jeu