DYNAMOF : un programme pour l'analyse dynamique de données de relaxation obtenues à champs magnétiques multiples

Philippe Barthe; Virginie Ropars; Christian Roumestand

doi:10.1016/j.crci.2005.06.023

DYNAMOF : un programme pour l'analyse dynamique de données de relaxation obtenues à champs magnétiques multiples

Philippe Barthe ¹ ; Virginie Ropars ¹ ; Christian Roumestand ¹

¹ Centre de biochimie st ructurale, UMR CNRS 5048–Inserm 554–UMI, faculté de pharmacie, 15, avenue Charles-Flahault, BP 14491, 34093 Montpellier cedex 05, France

Comptes Rendus. Chimie, Volume 9 (2006) no. 3-4, pp. 503-513.

Résumés

Français
Anglais

Cet article décrit un programme écrit en langage MATLAB utilisable pour l'analyse dynamique de données de relaxation enregistrées à différentes valeurs d'induction magnétique B₀. Suivant l'approche de l'échantillonnage réduit des densités spectrales — fondée sur l'approximation des hautes fréquences — ce programme calcule les valeurs des densités spectrales J(0), J(ω_X) et < J(ω_H) > à partir des vitesses de relaxation hétéronucléaire (¹⁵N ou ¹³C) R₁, R₂ et de la valeur du NOE hétéronucléaire. Un ajustement des densités spectrales avec différentes variantes du modèle de Lipari–Szabo est alors proposé, permettant l'obtention des paramètres du mouvement (temps de corrélation et paramètres d'ordre) ainsi que de la contribution d'échange R_éch. Le choix du modèle approprié peut alors être réalisé par une analyse statistique (test du χ², F-test). Un exemple d'application est donné sur l'analyse de données de relaxation ¹⁵N mesurées à 9,4, 11,75 et 14,1 Tesla (correspondant à des fréquences protons de 400, 500 et 600 MHz) sur la protéine P13^MTCP1. .

DYNAMOF: a program for the dynamics analysis of relaxation data obtained at multiple magnetic fields. This manuscript describes a MATLAB program devoted to the analysis of relaxation data obtained at different values of magnetic induction B₀. Using Reduced Spectral Density Mapping (based on the High-Frequency Approximation), J(0), J(ω_X) and < J(ω_H) > are calculated from heteronuclear (¹⁵N ou ¹³C) R₁, R₂ relaxation rates and heteronuclear NOE ratio values. In order to obtain the motion parameters (correlation times and order parameters), spectral densities are then fitted with the different variants of the Lipari–Szabo model. Then, the choice of the right model can be chosen through a statistical analysis (χ², F-test). As an application, the dynamics analysis of the ¹⁵N relaxation data obtained at 9.4, 11.75 and 14.1 Tesla (corresponding to proton frequencies of 400, 500 and 600 MHz) on the protein P13^MTCP1 is given. .

Métadonnées

Reçu le : 2005-04-05
Accepté le : 2005-06-13
Publié le : 2005-08-31

DOI : 10.1016/j.crci.2005.06.023

Mot clés : Relaxation hétéronucléaire, Analyse dynamique, Modèle de Lipari–Szabo, MATLAB
Mots clés : Heteronuclear relaxation, Dynamics analysis, Lipari–Szabo model, MATLAB

Affiliations des auteurs :

Philippe Barthe ¹ ; Virginie Ropars ¹ ; Christian Roumestand ¹

¹ Centre de biochimie st ructurale, UMR CNRS 5048–Inserm 554–UMI, faculté de pharmacie, 15, avenue Charles-Flahault, BP 14491, 34093 Montpellier cedex 05, France

@article{CRCHIM_2006__9_3-4_503_0,
     author = {Philippe Barthe and Virginie Ropars and Christian Roumestand},
     title = {DYNAMOF~: un programme pour l'analyse dynamique de donn\'ees de relaxation obtenues \`a champs magn\'etiques multiples},
     journal = {Comptes Rendus. Chimie},
     pages = {503--513},
     publisher = {Elsevier},
     volume = {9},
     number = {3-4},
     year = {2006},
     doi = {10.1016/j.crci.2005.06.023},
     language = {fr},
}

TY  - JOUR
AU  - Philippe Barthe
AU  - Virginie Ropars
AU  - Christian Roumestand
TI  - DYNAMOF : un programme pour l'analyse dynamique de données de relaxation obtenues à champs magnétiques multiples
JO  - Comptes Rendus. Chimie
PY  - 2006
SP  - 503
EP  - 513
VL  - 9
IS  - 3-4
PB  - Elsevier
DO  - 10.1016/j.crci.2005.06.023
LA  - fr
ID  - CRCHIM_2006__9_3-4_503_0
ER  -

%0 Journal Article
%A Philippe Barthe
%A Virginie Ropars
%A Christian Roumestand
%T DYNAMOF : un programme pour l'analyse dynamique de données de relaxation obtenues à champs magnétiques multiples
%J Comptes Rendus. Chimie
%D 2006
%P 503-513
%V 9
%N 3-4
%I Elsevier
%R 10.1016/j.crci.2005.06.023
%G fr
%F CRCHIM_2006__9_3-4_503_0

Philippe Barthe; Virginie Ropars; Christian Roumestand. DYNAMOF : un programme pour l'analyse dynamique de données de relaxation obtenues à champs magnétiques multiples. Comptes Rendus. Chimie, Volume 9 (2006) no. 3-4, pp. 503-513. doi : 10.1016/j.crci.2005.06.023. https://comptes-rendus.academie-sciences.fr/chimie/articles/10.1016/j.crci.2005.06.023/

Version originale du texte intégral

1 Introduction

L'utilité de l'analyse de la dynamique interne des macromolécules biologiques pour la compréhension des processus impliqués dans leurs mécanismes d'action n'est plus à démontrer. De ce fait, les mesures de relaxation hétéronucléaire — plus spécialement celles des noyaux ¹⁵N — se sont particulièrement développées au cours de cette dernière décennie (pour une revue récente, voir : [1]). L'analyse de ces données en termes de dynamique interne peut se faire par différentes approches, allant de l'interprétation directe de l'allure des fonctions de densités spectrales (Spectral density mapping) [2–6], jusqu'à une analyse plus élaborée par divers formalismes, permettant l'obtention des paramètres du mouvement. Dans cette dernière approche, le formalisme de Lipari–Szabo (Model Free) [7] est probablement le modèle le plus populaire et le plus utilisé. La relevance des résultats obtenus par cette approche repose néanmoins sur la qualité et la quantité des données expérimentales recueillies (R₁, R₂ et NOE hétéronucléaires, en général). Bien que relativement simple, l'ajustement du modèle aux données expérimentales sera d'autant plus précis et fiable que les données expérimentales fournies seront plus nombreuses, surtout dans le cas de mouvements complexes nécessitant l'ajustement de nombreux paramètres (modèle de Lipari–Szabo étendu) [8,9]. De ce fait, une analyse des données de relaxation mesurées à plusieurs intensités de champ magnétique paraît être une approche souhaitable [10,11]. Nous présentons ici un programme MATLAB (DYNAMOF, pour DYNamics Analysis with MOdel-Free) permettant l'analyse de telles données. Ce programme permet de calculer les densités spectrales réduites J(0), J(ω_N) et < J(ω_H) > à partir des données expérimentales précitées, puis de les ajuster avec le(s) formalisme(s) de Lipari–Szabo. Nous présenterons un exemple d'application sur des données de relaxation mesurées à trois inductions B₀ différentes sur la protéine oncogène P13^MTCP1 [12,13].

2 Matériels et méthodes

Théorie : quand la relaxation d'un hétéronoyau X dépend essentiellement de l'interaction dipolaire avec un proton directement lié et de l'anisotropie de son déplacement chimique, les données de relaxation peuvent être interprétées en termes de mouvement du vecteur X–¹H [14]. Sachant que les trois paramètres de relaxation mesurés expérimentalement (R_X(X_z) ou R₁, R_X(X_xy) ou R₂, et X{¹H}NOE) dépendent des valeurs des fonctions de densité spectrale à cinq fréquences différentes [2,3], le calcul des densités spectrales peut être approché par l'approximation des hautes fréquences permettant un échantillonnage « réduit » de la fonction de densité spectrale. L'approximation des hautes fréquences implique une quasi égalité des valeurs des densités spectrales à haute fréquence (J(ω_H – ω_N) ≈ J(ω_H + ω_N) ≈ J(ω_H) = < J(ω_H) >, ce qui impose un temps de corrélation relativement important (> 1 ns) et des valeurs d'inductions de champ magnétique relativement élevées pour réaliser les mesures de relaxation (en général ≥ 9,4 T). Ces conditions sont généralement réalisées lors de l'étude de la dynamique interne d'une protéine en solution. Si ces conditions sont réunies, les vitesses de relaxation sont directement traduites en densités spectrales à trois fréquences [4–6] par la relation :

[\begin{matrix} J (0) \\ J (ω_{X}) \\ J (ω_{H}) \end{matrix}] = [\begin{matrix} \frac{- 3}{4 (3 d^{2} + c^{2})} & \frac{3}{2 (3 d^{2} + c^{2})} & \frac{- 9}{10 (3 d^{2} + c^{2})} \\ \frac{1}{(3 d^{2} + c^{2})} & 0 & \frac{- 7}{5 (3 d^{2} + c^{2})} \\ 0 & 0 & \frac{1}{5 d^{2}} \end{matrix}] × [\begin{matrix} R_{X} (X_{z}) \\ R_{X} (X_{x, y}) \\ R_{X} (H_{z} \to X_{z}) \end{matrix}]

(1)

dans laquelle d^{2} = {(\frac{µ_{0}}{4π})}^{2} {(\frac{h γ_{H} γ_{X}}{4 π r_{X H}^{3}})}^{2} et c^{2} = \frac{1}{3} {(γ_{X} B_{0})}^{2} {(Δ σ)}^{2}

où μ₀ est la perméabilité du vide, h la constante de Planck, γ_H (2.6752 × 10⁸ rad T⁻¹ par seconde) le rapport gyromagnétique du proton, γ_X les rapports gyromagnétiques des noyaux X (2.711 × 10⁷ et 6.726 × 10⁷ rad T⁻¹ par seconde pour ¹⁵N et ¹³C, respectivement), ω_H et ω_X les fréquences de Larmor ¹H et X, et r_XH la distance internucléaire X–¹H (1,02 et 1,07 Å pour ¹⁵N–¹H et ¹³C_α–¹H, respectivement), B₀ l'intensité du champ magnétique, et Δσ la différence entre les composantes parallèles et perpendiculaires du tenseur de déplacement chimique de symétrie axiale (–170 ppm pour ¹⁵N [15], 25 ppm pour ¹³C_α [22]). La vitesse de corrélation croisée R_X(H_z→X_z) entre le noyau X et le proton lié est corrélée au NOE hétéronucléaire et calculée par la relation : NOE = 1 + (γ_H/γ_X) R_X(H_z→X_z)/R_X(X_z). La fréquence de la densité spectrale moyenne < J(ω_H) >, a été prise égale à 0,87 ω_H [16].

Cette approche, dite de « cartographie », de la fonction de densité spectrale permet de juger rapidement de la dynamique interne de la protéine. En effet, une protéine en solution est soumise aux lois de la thermodynamique : elle représente un système à l'équilibre dont l'énergie est conservée. Cela se traduit par la conservation de la quantité de mouvement pour chacun des vecteurs (¹⁵N–H ou ¹³C–H) caractéristiques de chacun de ses résidus, et donc la conservation de l'aire sous la courbe des fonctions de densité spectrale propres à chacun de ces vecteurs (voir Fig. 2). Ainsi, les zones flexibles de la protéine sont caractérisées par des valeurs faibles de J(0) (fréquence représentative des mouvements lents), contrebalancées par des valeurs élevées de < J(ω_H) > (fréquence représentative des mouvements rapides). À l'inverse, les zones rigides présentent des valeurs élevées de J(0) et faibles de < J(ω_H) >. Certains résidus peuvent déroger à cette règle à cause d'une contribution adiabatique à leur relaxation, généralement apportée par des phénomènes d'échange chimique ou conformationnel s'établissant sur une échelle de temps supérieure à celle du temps de corrélation de la molécule (μs–ms). Bien que parfaitement rigoureuse, cette analyse des fonctions de densité spectrale n'apporte qu'une information qualitative sur la dynamique de la protéine étudiée : aucune information sur les échelles de temps caractéristiques des mouvements qui animent chaque résidu ne peut être obtenue. Néanmoins, elle peut être facilement complétée par l'utilisation d'un modèle de mouvement permettant d'ajuster aux mieux les densités spectrales des différents vecteurs. L'approche model-free de Lipari et Szabo [7] peut être ainsi utilisée pour ajuster les valeurs expérimentales des fonctions de densités spectrales et obtenir les paramètres du mouvement. Du fait de la différence importante de leur domaine de temps respectif, ce formalisme fait l'hypothèse d'une contribution indépendante du mouvement global (ou des mouvements globaux) et des mouvements internes à la fonction d'autocorrélation des vecteurs X–¹H. Pour une protéine qui se réoriente de façon isotrope, on obtient :

\begin{matrix} J (ω) = \frac{2}{5} {S^{2} \frac{τ_{c}}{1 + {(ω τ_{c})}^{2}} + (1 - S^{2}) \frac{τ}{1 + {(ω τ)}^{2}}} \end{matrix}

(2)

où τ_c est le temps de corrélation global du vecteur X–¹H, τ la somme harmonique des temps de corrélation global et interne (rapide) relatif à chaque résidu : τ⁻¹ = τ_c⁻¹ + τ_f⁻¹. Les mouvements rapides internes sont caractérisés par le paramètre d'ordre généralisé S², relié aux amplitudes relatives de ces mouvements et variant entre 0 (mouvement non contraint) et 1 (absence de mouvement), et le temps de corrélation τ_f.

Fig. 2
Vitesses de relaxation hétéronucléaire ¹⁵N (de haut en bas) R₂, R₁ et {¹H,¹⁵N}NOE (I/I₀) en fonction de la séquence de la protéine P13^MTCP1. Ces paramètres de relaxation ont été mesurés à 400 (symboles noirs), 500 (symboles rouges) et 600 MHz (symboles bleus). Les valeurs de R₁ et R₂ ont été obtenues pour chaque acide aminé à partir de la décroissance mono-exponentielle de l'intensité du pic de corrélation ¹H–¹⁵N correspondant sur les expériences hétéronucléaires 2D classiques (voir § Matériel et méthodes).

Pour certains résidus, l'équation [2] s'avère insuffisante pour ajuster les valeurs expérimentales des densités spectrales : cela notamment pour des résidus qui présentent des mouvements internes sur un domaine de temps proche de 1 ns. Dans ce cas, l'expression de la fonction de densité spectrale est étendue à [8,9] :

J (ω) = \frac{2}{5} {S_{f}^{2} S_{s}^{2} \frac{τ_{c}}{1 + {(ω τ_{c})}^{2}} + S_{f}^{2} (1 - S_{s}^{2}) \frac{τ}{1 + {(ω τ)}^{2}} + (1 - S_{f}^{2}) \frac{τ'}{1 + {(ω τ')}^{2}}}

(3)

où τ⁻¹ = τ_c⁻¹ + τ_s⁻¹ et τ′⁻¹ = τ_c⁻¹ + τ_f⁻¹. S_f² et S_s² sont respectivement les carrés des paramètres d'ordre partiel pour les mouvements internes rapides (τ_f, échelle de la picoseconde) et lents (τ_s, échelle de la nanoseconde). Le carré du paramètre d'ordre généralisé S², defini comme S_f²S_s², constitue une mesure de l'amplitude totale des mouvements internes. En général, on peut négliger la contribution des mouvements internes les plus rapides, si bien que l'expression de la fonction de densité spectrale devient :

J (ω) = \frac{2}{5} {S_{f}^{2} S_{s}^{2} \frac{τ_{c}}{1 + {(ω τ_{c})}^{2}} + S_{f}^{2} (1 - S_{s}^{2}) \frac{τ}{1 + {(ω τ)}^{2}}}

(4)

Enfin, certains résidus présentent des valeurs de J(0) anormalement élevées, signant la présence d'une contribution adiabatique à la fonction de densité spectrale. Cette contribution est due à la présence de mouvements sur une échelle de temps allant de la micro- à la milliseconde (plus lent que le temps de réorientation de la molécule), généralement reliés à un échange conformationnel et essentiellement perçus par la mesure de R₂. Pour de tels résidus, la valeur de J(0) doit être corrigée de cette contribution d'échange (R_éch) avant d'ajuster la fonction de densité spectrale par le modèle de Lipari–Szabo. Cette correction peut être apportée grâce à une relation linéaire existant entre la valeur de 2 R₂ – R₁ et les fréquences de Larmor hétéronucléaires ω_X² [17,23] :

2 R_{2} - R_{1} = d^{2} [J (0) + \frac{3}{2} J (ω_{H})] + [\frac{4 c^{2}}{9} J (0) + 2 ϕ] ω_{X}^{2}

(5)

la valeur du facteur d'échange ϕ (R_éch = ϕ ω_X² [Eq. (6)]) est obtenue d'après la valeur de la pente. La valeur de J(0) peut alors être corrigée en utilisant la relation :

{J (0)}_{obs =} {J(0)}_{cor} + λ ϕ ω_{X}^{2}

(7)

où λ est un facteur d'échelle dépendant de la fréquence de mesure et égal à (3/2) [1/(3 d² + c²)]. Alternativement, la valeur de ϕ peut être obtenue par l'ajustement direct de la fonction de densité spectrale par le modèle de Lipari–Szabo, en utilisant la fonction suivante pour J(0), obtenue en combinant les équations [2] et [7] :

J (0) = \frac{2}{5} {S_{f}^{2} τ_{c} + (1 - S_{f}^{2}) τ} + λ ϕ ω_{X}^{2}

(8)

La complexité croissante de ces différents modèles entraîne une augmentation très significative du nombre de paramètres permettant leur description. Ainsi, généralement deux paramètres sont à ajuster pour une analyse avec le modèle de Lipari–Szabo simple, contre trois — voire quatre ! — avec le modèle de Lipari–Szabo étendu. Or, les données de relaxation classiquement enregistrées à un seul champ magnétique ne permettent d'obtenir que seulement trois valeurs de densité spectrale : J(0), J(ω_N) et <J(ω_H)>.

Le problème devient très vite sous-estimé (du moins partiellement), et le recours à un meilleur échantillonage de la fonction densité spectrale nécessaire. La simulation reportée sur la Fig. 1 montre bien qu'en effet, si l'analyse à une fréquence est suffisante pour détecter la contribution d'un mouvement interne au mouvement global d'un vecteur, seul le recours à une analyse à plusieurs fréquences est capable de révéler la relative complexité de ce mouvement interne.

Fig. 1
Les valeurs de densité spectrale réduite reportées sur cette figure ont été calculées pour cinq inductions de champ magnétique différentes (correspondant à des fréquences protons de 400, 500, 600, 700 et 800 MHz) avec le modèle de Lipari–Szabo étendu (équation [3] : τ_c = 10 ns, τ_s = 0,3 ns, τ_f = 3 ps, S_f = S_s = 0,5). Elles décrivent le mouvement complexe d'un vecteur tel que celui formé par exemple par le groupement ¹⁵N–H d'un résidu dans une protéine en solution animée d'un mouvement Brownien global (τ_c = 10 ns, concevable pour une protéine d'environ 10 kDa), et porté par un segment peptidique animé d'un mouvement interne complexe (également diffusif), peu contraint (S² = 0,25), et comprenant deux composantes caractérisées par les temps de corrélation τ_s = 0,3 ns, τ_f = 3 ps. Ces différents mouvements sont répartis sur des échelles de temps très différentes et peuvent être considérés comme non corrélés. Seules les valeurs à 600 MHz (a) ou la totalité de ces valeurs de densité spectrale (b) ont été ajustées avec le modèle « sphère rigide » (J(ω) = 2/5{τ_c/(1 + (ω τ_c)²}) (courbe noire), le modèle de Lipari–Szabo [éq. (2)] et le modèle de Lipari–Szabo étendu [éq. (4)]. Si le temps de corrélation τ_c représente la variable ajustable dans le cas du modèle rigide, sa valeur a été fixé à 10 ns lors des ajustements avec les différentes variantes du modèle de Lipari–Szabo.

Le programme DYNAMOF présenté dans ce manuscrit utilise cette stratégie pour analyser les données de relaxation enregistrées à plusieurs intensités de champ magnétique. Une procédure de type SIMPLEX a été adoptée pour ajuster les valeurs de densités spectrales expérimentales aux différentes variantes du modèle de Lipari–Szabo, dont la convergence est assurée par la minimisation d'un χ² calculé entre les valeurs expérimentales et les valeurs théoriques obtenues avec les différents modèles. Le choix du modèle pertinent se fera ensuite en comparant les valeurs de χ² obtenues pour les différents ajustements grâce à un test de Fischer–Snedecor (F-test).

Mesures expérimentales : Les expériences de RMN ont été réalisées à 9,4, 11,75 et 14,1 Tesla sur des spectromètres Bruker Avance 400, 500 et 600 équipés de sondes 5 mm triple résonance ¹H–¹³C–¹⁵N munies de gradient-z, et sur un échantillon de protéine P13^MTCP1 uniformément enrichie en ¹⁵N dissoute à une concentration de 1 mM dans 500 μl de tampon Tris-HCl 10 mM pH 7,0 (5% ²H₂O pour le lock). La température de mesure a été soigneusement calibrée à 20 °C sur chacun des spectromètres. Les séquences d'impulsions utilisées pour déterminer les valeurs des vitesses de relaxation ¹⁵N R_N(N_z) (R₁), R_N(N_xy) (R₂), et de ¹⁵N{¹H}NOE sont similaires à celles déjà décrites [2,3], et les paramètres expérimentaux utilisés ainsi que le traitement des données ont déjà été reportés en détail pour d'autres protéines étudiées au laboratoire [13,18]. La vitesse de relaxation longitudinale ¹⁵N (R_N(N_z)) a été obtenue à partir de dix expériences d'inversion–récupération, avec des délais de relaxation allant de 18 à 1026 ms. La vitesse de relaxation transverse ¹⁵N (R_N(N_xy)) a été obtenue à partir de dix expériences CPMG, avec des délais de relaxation allant de 16 à 144 ms. La valeur du NOE hétéronucléaire ¹⁵N{¹H} a été déterminée à partir du rapport de deux expériences réalisées avec et sans présaturation des protons. Les spectres RMN ont été traités à l'aide du logiciel Gifa (version 4.4) [21]. Le résultat de ces mesures expérimentales est reporté sur la Fig. 2.

3 Résultats

La Fig. 3 présente l'organigramme général du programme DYNAMOF. Le programme débute en demandant un suffixe (par exemple out), qui sera attribué à tous les fichiers de sortie (fichier out) créés lors de son utilisation. Après avoir offert la possibilité de changer en cours d'utilisation certaines valeurs de constantes entrées en valeurs par défaut (Δσ, valeurs de départ utilisées dans les procédures SIMPLEX...), l'utilisateur doit entrer le type de noyau utilisé pour l'analyse (¹⁵N ou ¹³C), puis le nombre de champs magnétiques utilisés. Après avoir laissé le choix entre l'analyse classique (Spectral density mapping) et celle récemment proposée par Roumestand et al. (Fast spectral density mapping, soumis à publication) que nous ne développerons pas ici, l'utilisateur doit entrer les différentes fréquences de mesures protons en ordre croissant (400, 500, puis 600) ainsi que le nom générique (gnam) des fichiers d'entrée correspondant à ces fréquences de mesure. Ces fichiers d'entrée consistent en trois fichiers textes pour chaque fréquence de mesure (R₁, R₂ et NOE (I/I₀)), correspondant aux fichiers directement obtenus par l'analyse des données RMN par le module « Relaxation » du programme de traitement des données Gifa 4 [21]. Ces fichiers sont des tableaux à trois colonnes, chacune contenant respectivement le numéro du résidu (position dans la séquence), la valeur du paramètre de relaxation, et l'erreur mesurée sur ce paramètre. À chacun de ces fichiers, on attribue un suffixe (en général la fréquence de mesure) qui constituera son nom générique (par exemple : R₁_400, R₂_400 et NOE_400 correspondent aux mesures de relaxation effectuées sur P13^MTCP1 à 400 MHz (generic name = 400)). Pour chaque fréquence, le programme calcule les valeurs des densités spectrales réduites en utilisant l'équation (1) ainsi que les erreurs correspondantes, qui seront stockées dans deux fichiers sortie différents (par exemple : J 400.out et dJ 400.out). Une sortie graphique reportant, pour chaque champ de mesure, les valeurs de densités spectrales réduites en fonction de la séquence de la protéine permet d'apprécier rapidement la qualité des données (Fig. 4).

Fig. 3
Organigramme général du programme DYNAMOF.

Fig. 4
Représentation graphique du résultat du calcul des densités spectrales à partir des données de relaxation R₁, R₂ et NOE obtenues à 400 MHz (gnam : 401) sur la protéine P13^MTCP1 [Eq. (1)].

À partir de cette étape, le programme propose de corriger les valeurs de J(0) d'une éventuelle contribution d'échange. Si l'utilisateur accepte ce choix, le facteur d'échange ϕ sera calculé par régression linéaire en utilisant l'équation [5] : un affichage graphique des données pour chaque résidu est proposé (Fig. 5a), puis le programme va afficher la valeur de ϕ en fonction de la séquence (Fig. 5b) et créer deux fichiers (PHI_R.out et Rex_R.out), correspondant l'un aux valeurs de ϕ par résidu, l'autre aux valeurs de R_éch calculées à partir de ϕ [éq. (6)] pour chaque champ de mesure. Les erreurs sur ϕ seront calculées par une procédure Monte-Carlo (nombre d'itérations choisies par l'utilisateur). Le fichier PHI_R.out contient également les valeurs corrigées de J(0) (et dJ(0)) : ces valeurs sont introduites dans deux nouveaux fichiers, contenant les valeurs de densités spectrales et les erreurs correspondantes : J_gnamcorR.out et dJ_gnamcorR.out (ex J_400corR.out et dJ_400corR.out pour la fréquence 400 MHz). Ce sont dès lors ces fichiers qui seront utilisés par défaut pour l'ajustement avec les différents modèles de mouvement.

Fig. 5
(a) Obtention du facteur d'échange ϕ par régression linéaire à partir de l'équation [5] (résidu 97). (b) Facteur d'échange ϕ en fonction de la séquence de la protéine P13^MTCP1.

Cette étape de calcul (et éventuellement de correction) des fonctions densités spectrales effectuées, le programme va débuter l'ajustement des données avec les différents modèles de mouvement décrits dans la partie Matériel et méthodes. En premier lieu, le programme va demander à l'utilisateur de choisir entre un ajustement « local » (un τ_c par résidu) ou « global » (le même τ_c pour tous les résidus de la protéine) des données : l'ajustement local des données peut s'avérer judicieux lorsque la protéine présente des domaines avec des comportements dynamiques très différents, ou lorsque la réorientation de la protéine en solution ne peut plus être considérée comme isotrope [11,19,20].

• Ajustement Local (une valeur de τ_c par résidu). Avant de démarrer la procédure d'optimisation, le programme offre encore à l'utilisateur la possibilité d'ajuster la contribution d'échange (ϕ : Eq. (8)) si la correction proposée à l'étape précédente n'a pas été réalisée : les paramètres τ_c, τ_f, S² et éventuellement ϕ seront alors obtenus résidu après résidu par ajustement des 2 n + 1 (n étant le nombre de champs magnétiques utilisés) valeurs expérimentales de densité spectrale (J(0), J(40), J(50), J(60), < J(400) >, < J(500) > et < J(600) > dans le cas de p13^MTCP1) par le modèle de Lipari–Szabo (Eq. (2), légèrement modifiée : la contribution haute fréquence au mouvement est supposée indépendante de la fréquence et, de ce fait, ω τ négligé [11]). Une sortie graphique est proposée pour chaque résidu, permettant d'apprécier la qualité de chacun des ajustements. Deux fichiers sont créés à la fin de la procédure, contenant le résultat de chacun des ajustements (LOCAL.out, optimisation de τ_c, τ_f et S²–LOCALREX.out, optimisation de τ_c, τ_f, S² et ϕ). Un χ² expérimental est calculée pour chaque modèle et pour chaque résidu, dont le résultat est également contenu dans le fichier correspondant : ces valeurs de χ² pourront être utilisées pour sélectionner le modèle optimum grâce à une analyse statistique. Enfin, un calcul de type Monte-Carlo va permettre de déterminer les erreurs sur chacune des variables (nombre d'itérations choisi par l'utilisateur) : ces erreurs seront contenues dans deux fichiers « définitifs », à côté des valeurs des variables τ_c, τ_f, S² et ϕ (LOCAL_MC.out et LOCALREX_MC.out). Cette étape crée également deux fichiers supplémentaires contenant pour chaque résidu les valeurs de χ² obtenues après chaque itération et ce pour chacun des deux modèles (χ2_CAN_MC.out et χ2_CANREX_MC.out). Ces fichiers pourront être utilisés pour une analyse statistique plus poussée (en cours d'implémentation dans le programme).
• Ajustement global (une valeur de τ_c commune à tous les résidus). Dans une première étape, le programme va tenter de déterminer la valeur commune du τ_c en ajustant résidu par résidu les valeurs des densités spectrales expérimentales par le modèle de Lipari–Szabo [Eq. (2)] et en tentant d'optimiser pour chaque résidu les valeurs de τ_c, τ_f et S². Une sortie graphique est proposée pour chaque résidu, permettant d'apprécier la qualité de l'ajustement (Fig. 6a). En fin de procédure, un fichier LS3.out est créé, contenant les résultats de l'ajustement pour chaque résidu. La terminologie LS3 signifie que ce fichier a été obtenu à partir du modèle de Lipari–Szabo (LS), en optimisant trois paramètres : τ_c, τ_f et S². Une sortie graphique présente les valeurs de τ_c en fonction de la séquence et propose une valeur moyenne (± 2σ) utilisable comme valeur de τ_c « global » (Fig. 6b). Cette valeur de τ_c pourra être alors utilisée comme constante dans le reste de la procédure qui va consister à ajuster les 2 n + 1 valeurs expérimentales de densités spectrales avec le modèle de Lipari–Szabo simple [Eq. (2)] (LS2, deux variables à optimiser : τ_f et S²), le modèle de Lipari-Szabo simple avec contribution d'échange [Eq. (2) et (8)] (LSREX, trois variables à optimiser : τ_f, S² et ϕ), et les modèles de Lipari–Szabo étendus [Eq. (3) et (4)] (LSE3, trois variables à optimiser : S²_s, S²_f et τ_s – LSE4, quatre variables à optimiser : S²_s, S²_f, τ_s et τ_f). Comme précédemment, une sortie graphique est proposée résidu par résidu, permettant de juger la qualité de l'ajustement par chaque modèle (Fig. 7). Quatre fichiers sont alors créés (LS2.out, LSREX.out, LSE3.out et LSE4.out), contenant les résultats obtenus avec les modèles respectifs. Tout comme pour l'approche « locale », un χ² expérimental est calculée pour chaque modèle et pour chaque résidu, dont le résultat est également contenu dans le fichier correspondant : ces valeurs de χ² pourront être utilisées pour sélectionner le modèle optimum grâce à une analyse statistique. De même, les erreurs sur chacun des paramètres peuvent alors être calculées par une procédure Monte-Carlo (l'utilisateur choisit le nombre d'itérations) : cette étape conduira à la création de quatre nouveaux fichiers contenant à la fois les valeurs des paramètres optimisés et les erreurs calculées sur ces paramètres (LS2_MC.out, LSREX_MC.out, LSE3_MC.out et LSE4_MC.out). De même, quatre fichiers (correspondant aux quatre modèles) seront créés contenant les valeurs de χ² obtenues à chaque itération du calcul de Monte-Carlo pour chaque résidu (χ2_LS2_MC.out, χ2_LSREX_MC.out, χ2_LSE3_MC.out, χ2_LSE4.out) : ces derniers seront utilisés pour une analyse statistique plus poussée qui est en cours d'implémentation dans le programme.

Fig. 6
**(a)** Ajustement des valeurs de densité spectrale obtenues pour le résidu 46 de la protéine P13^MTCP1 par le modèle LS3 (voir texte) ; ces valeurs sont reportées sur un axe arithmétique (gauche) ou logarithmique (droite). **(b)** Valeurs de τ_c en fonction de la séquence. La ligne verte représente la valeur moyenne du τ_c calculée sur les résidus représentés en cercles verts (τ_c ± 2 σ).

Fig. 7
Ajustement des valeurs de densité spectrale calculées pour le résidu 39 de la protéine P13^MTCP1 par les différents modèles proposés dans l'approche « globale » (LS2, LSREX, LSE3, et LSE4) (voir texte) ; les valeurs de densité spectrale sont reportées sur un axe arithmétique (gauche) ou logarithmique (droite).

On notera que chaque fois qu'un ajustement par un modèle est effectué, que ce soit dans la procédure « locale » ou « globale », un fichier contenant les valeurs des densités spectrales théoriques (et, après un calcul Monte-Carlo, un fichier contenant les erreurs sur les densités spectrales théoriques) est créé, du type Jtheo_nomdumodèle.out (ou jtheo_nomdumodele_MC.out, dJtheo_nomdumodele_MC.out). Ces fichiers pourront être également utilisés dans une analyse statistique.

4 Discussion

Le programme décrit dans ce manuscrit permet d'analyser des données de relaxation enregistrées à une ou plusieurs intensités de champ magnétique B₀. Il a été écrit en langage MATLAB (version 4.2c.1) sur un ordinateur MacIntosch (MacOS9) : la portabilité de ce langage le rend utilisable sur tout autre type de plateforme et système d'exploitation (MacOS X, Windows, Linux, UNIX). Une version en langage OCTAVE a été testé notamment sur des données de relaxation mesurées à trois intensités de champ magnétique sur la protéine P13^MTCP1 : les résultats de l'analyse dynamique sont présentés sur la Fig. 8. Pour cette protéine relativement globulaire et de symétrie quasi-sphérique, l'approche « globale » (une valeur de τ_c commune à tous les résidus) est pertinente. Notre analyse nous a permis de déterminer un temps de corrélation global de 10,4 ns, compatible avec la taille de la protéine (107 résidus, 13 kDa) et la température à laquelle ont été réalisées les mesures (20 °C). Elle montre également des mouvements internes relativement contraints dans le tonneau β (modèle LS2), alors que la longue boucle, qui relie les deux motifs de feuillet β constituant le tonneau, est animée par des mouvements internes relativement complexes, avec des temps de corrélation proches de la nanoseconde (modèle LSE3, l'utilisation du modèle LSE4 n'apportant pas une amélioration statistiquement significative de l'ajustement). De tels mouvements ont été également identifiés sur l'une des deux boucles « plissées » qui émergent sur une face du tonneau β. Comme le montrait déjà la relative dispersion des valeurs de J(0), des contributions d'échange significatives ont été mesurées pour de nombreux résidus, répartis sur des zones bien particulières de la protéine : une face du tonneau β, autour de l'hélice présente dans la longue boucle, sur l'autre boucle « plissées » émergeant du tonneau β… Des valeurs similaires pour ces contributions d'échange ont été obtenues par correction des valeurs de J(0) [17] ou par ajustement direct des valeurs expérimentales (modèle LSREX).

Fig. 8
Résultats de l'analyse dynamique des données de relaxation mesurées sur P13^MTCP1 à trois intensités de champ magnétique. **(a)** paramètres dynamiques (S², τ_f, τ_s et ϕ) obtenus en ajustant les données expérimentales avec les modèles LS2 (rouge), LSREX (orange) et LSE3 (jaune). **(b)** deux vues à 180° d'une représentation en ruban de la protéine P13^MTCP1 montrant la restriction des mouvements internes : le ruban a été colorée avec le même code de couleur qu'en **(a)**.

Si des résultats similaires peuvent être obtenus en analysant les données de relaxation obtenues à une seule fréquence de mesure (résultats non montrés), l'analyse à plusieurs fréquences permet une bien meilleure discrimination entre les différents modèles par les tests statistiques utilisés, et augmente ainsi notre confiance dans les résultats de notre analyse dynamique.

Le programme DYNAMOF est téléchargeable à partir du serveur du Centre de biochimie structurale (ftp://ftp.cbs.cnrs.fr/pub/DYNAMOF_1.0.zip).

Remerciements

Le travail de Virginie Ropars est financé par une bourse de la Ligue contre le cancer. L'étude des protéines oncogéniques de la famille TCL1 constitue un projet du laboratoire soutenu par l'Association pour la recherche contre le cancer. La conversion des données de relaxation en valeurs de densité spectrale utilise une routine MATLAB écrite par J.-F. Lefèvre : Philippe Barthe et Christian Roumestand remercient cet ami, malheureusement trop tôt disparu, qui a su leur communiquer sa passion pour l'étude de la dynamique interne des protéines et la relation entre les propriétés dynamiques des protéines et leur activité.

Bibliographie

[1] R.A. Atkinson; B. Kieffer Prog. Nucl. Magn. Reson. Spectrosc., 44 (2004), p. 141

[2] J.W. Peng; G. Wagner J. Magn. Reson., 98 (1992), p. 308

[3] J.W. Peng; G. Wagner Biochemistry, 31 (1992), p. 8571

[4] N.A. Farrow; R. Muhandiram; A.U. Singer; S.M. Pascal; C.M. Kay; G. Gish; S.E. Shoelson; T. Pawson; J.D. Foreman-kay; L.E. Kay Biochemistry, 33 (1994), p. 5984

[5] R. Ishima; K. Nagayama J. Magn. Reson., B108 (1995), p. 73

[6] J.-F. Lefèvre; K.T. Dayie; J.W. Peng; G. Wagner Biochemistry, 35 (1996), p. 2674

[7] G. Lipari; A. Szabo J. Am. Chem. Soc., 104 (1982), pp. 4546-4559

[8] G.M. Clore; A. Szabo; A. Bax; L.E. Kay; P.C. Driscoll; P.T. Wingfield; A.M. Gronenborn J. Am. Chem. Soc., 112 (1990), p. 4989

[9] G.M. Clore; P.C. Driscoll; P.T. Wingfield; A.M. Gronenborn Biochemistry, 29 (1990), p. 7387

[10] J.W. Peng; G. Wagner Biochemistry, 34 (1995), p. 16733

[11] D. Canet; P. Barthe; P. Mutzenhardt; C. Roumestand J. Am. Chem. Soc., 123 (2001), p. 4567

[12] Y.-S. Yang; L. Guignard; A. Padilla; F. Hoh; M.P. Strub; M.-H. Stern; J.-M. Lhoste; C. Roumestand J. Biomol. NMR, 11 (1998), p. 339

[13] L. Guignard; A. Padilla; J. Mispelter; Y.-S. Yang; M.-H. Stern; J.M. Lhoste; C. Roumestand J. Biomol. NMR, 17 (2000), p. 215

[14] A. Abragam Principles of Nuclear Magnetism, Oxford Science Publication, Clarendon Press, Oxford, UK, 1961

[15] N. Tjandra; A. Szabo; A. Bax J. Am. Chem. Soc., 118 (1996), p. 6986

[16] N.A. Farrow; O. Zhang; A. Szabo; D.A. Torchia; L.E. Kay J. Biomol. NMR, 6 (1995), p. 153

[17] J. Habazettl; G. Wagner J. Magn. Reson., B109 (1995), pp. 100-104

[18] P. Barthe; L. Chiche; N. Declerck; M.A. Delsuc; J.-F. Lefèvre; T. Malliavin; J. Mispelter; M.-H. Stern; J.-M. Lheste; C. Roumestand J. Biomol. NMR, 15 (1999), p. 271

[19] S. Bouguet; P. Mutzenhardt; C. Roumestand; D. Canet Concepts Magn. Reson., 24 (2005), p. 1

[20] S. Bouguet; P. Mutzenhardt; C. Roumestand; D. Canet Concepts Magn. Reson., 24 (2005), p. 9

[21] J.L. Pons; T.E. Malliavin; M.A. Delsuc J. Biomol. NMR, 8 (1996), p. 445

[22] C. Ye; R. Fu; J. Hu; L. Hou; S. Ding Mag. Reson. Chem., 31 (1993), p. 699

[23] H. Vis; C.E. Vorgias; K.S. Wilson; R. Kaptein; R. Boelens J. Biomol. NMR, 11 (1998), p. 265

Commentaires - Politique

Ces articles pourraient vous intéresser

Analysis of the C12A-p8^MTCP1 protein internal motions using fast spectral density mapping at multiple magnetic fields

Virginie Ropars; Julien Roche; Philippe Barthe; ...

C. R. Chim (2008)

Bases structurales de l'inhibition de la kinase Akt (PKB) par le peptide inhibiteur Akt-in : une étude RMN

Virginie Ropars; Jean-François Guichou; Daniel Auguin; ...

C. R. Chim (2006)

Détermination de l'état d'oligomérisation du domaine homologue à la pleckstrine de la protéine AKT2 par des techniques RMN

Daniel Auguin; Thierry Gostan; Marc-André Delsuc; ...

C. R. Chim (2004)