Dans son article [2], Joets propose de tester les deux hypothèses formulées par Souriau et al. [3,4] concernant la perception de deux manifestations sonores lors de l’explosion de l’usine AZF à Toulouse le 21 septembre 2001 : soit il y a eu deux explosions distinctes à l’origine des deux manifestations sonores, soit il a pu y avoir une seule explosion couplée avec le sol, le premier son étant dû à la conversion de l’onde sismique de compression (onde P) en onde sonore à l’interface sol-air, le deuxième étant dû à l’onde acoustique. Dans le premier cas (hypothèse 1), la différence de temps entre les deux émissions sonores doit être approximativement indépendante de la distance, si l’on néglige les probables effets supersoniques au voisinage des sources et à condition que les deux sources soient au même endroit. Dans le deuxième cas (hypothèse 2), la différence de temps entre les deux manifestations sonores doit augmenter avec la distance, ce qui résulte du fait que la propagation des ondes est plus rapide dans le sol que dans l’air.
C’est évidemment une bonne idée que de chercher à tester ces deux hypothèses, à l’aide d’enregistrements et de témoignages. Sans remettre en question les observations de Joets, il nous semble cependant important d’apporter quelques précisions sur ses affirmations et quelques réserves sur ses résultats.
La première réserve, et sans doute la plus sérieuse, concerne le lot de données étudié. On se demande comment l’auteur, au terme d’un « long et fastidieux travail de collecte de données », n’a pu trouver que 12 témoignages dignes de confiance. Plusieurs milliers de personnes travaillent à l’est du site d’AZF, là où Joets n’a pu donner que deux valeurs (CNES, ENAC, ENSAE, université, laboratoires et hôpital de Rangueil, zone industrielle de Montaudran, zone industrielle de Quint-Fonsegrives, etc.). Au sud-est, où aucun point n’est donné, se trouvent l’hôpital Larrey, l’Inra, les villes de Ramonville, Auzeville, Castanet, la zone commerciale et industrielle de Labège, etc. D’autre part, Joets n’indique pas le nombre de témoignages qui a été éliminé par rapport au nombre gardé, or c’est une information capitale. Le « long et fastidieux travail de collecte » laisse penser qu’un très grand nombre de témoignages a été collecté avant sélection et donc qu’il y avait de quoi faire sur ces données des analyses statistiques, les plus crédibles lorsqu’il s’agit de valeurs approchées et subjectives (ce qui est nécessairement le cas pour ce type d’observations). S’il y avait beaucoup de données au départ, il est clair qu’un beaucoup trop grand nombre d’entre elles a été éliminé, pour que le critère de sélection reste valable. Si le nombre de données au départ était faible, c’est que le travail de collecte a été insuffisant, ou que des données ne satisfaisant pas le modèle ont été d’emblée éliminées (par exemple, si le premier son n’a pas été un bang mais un grondement, suivant des témoignages que mentionne Joets, ou si un seul bang a été perçu, comme ce qu’ont rapporté des élèves en sortie géologique sur la colline de Pech David à environ 2 km à l’ESE du site d’AZF). Contrairement à ce que dit l’auteur, le résultat peut être extrêmement sensible aux données écartées dans la sélection, lorsqu’on part d’une distribution statistique en nuage dans laquelle il faut discerner une tendance et si l’on garde peu de données. Une approche statistique est d’autant plus cruciale que certains témoignages n’ont pas été rassemblés immédiatement après l’explosion, comme l’indique le « long travail de collecte » (la date de collecte aurait dû être mentionnée dans le tableau 1) et il est bien connu que les témoignages sont sujets à une variabilité importante quand le temps passe, en particulier à la suite d’un événement traumatisant.
Une deuxième série de critiques concerne les nombreux manques de rigueur ou incohérences de l’article [2], dont on peut s’étonner qu’ils n’aient pas été relevés par un relecteur de C. R. Geoscience avant publication. Par exemple, dans la Fig. 1 de gauche (qu’on désignera 1a) les unités ne sont pas précisées : les temps sont en secondes et les distances en mètres, avec une représentation en logarithmes népériens, alors que la représentation des distances de la figure de droite (qu’on notera 1b) est en logarithmes décimaux. Les données sont difficilement exploitables par d’autres chercheurs : en effet, le Tableau 1 ne donne pas les informations essentielles que sont les délais estimés entre les deux bangs et leurs incertitudes (mais celles-ci peuvent être retrouvées par numérisation de la Fig. 1a). Il apparaît clairement des incohérences entre ce tableau (qui reporte 12 observations), la Fig. 1a (avec 14 valeurs, les magnétophones donnant sans doute les deux points additionnels) et la Fig. 1b (avec 16 valeurs – que sont les deux points supplémentaires ?). Les enregistrements sur magnétophones (qui auraient dû être montrés) ne sont pas identifiés sur la Fig. 1 (sans doute s’agit-il des deux points situés juste entre les deux « droites sismo-acoustiques » sur la Fig. 1a ?). Les délais de cinq témoignages de qualité A (d’après le tableau) et des deux magnétophones, donc sept valeurs, devraient figurer sur la Fig. 1b (d’après la légende de la figure), or il n’y a que cinq valeurs : le délai du témoignage 3 manque, ainsi, sans doute, que celui d’un des magnétophones. Le témoignage 5 est reporté comme sismo-acoustique, alors que l’auteur indique que le témoin a perçu un bang précédant cette onde sismo-acoustique (donc le délai entre les deux bangs aurait pu être reporté). Un critère de directivité conduisant à proposer deux sources géographiquement distinctes se base sur seulement deux points à l’est dont un seul, d’ailleurs compatible avec la courbe sismo-acoustique, est de bonne qualité (qualité A). On peut aussi se demander si un bang, perçu comme modéré au voisinage de la source (les personnes reprennent leurs activités aussitôt), peut être audible à 48 km. Enfin, pourquoi des ondes sismo-acoustiques seraient-elles à basse fréquence, comme le dit Joets dans sa conclusion ? Leur nature va évidemment dépendre du contenu fréquentiel de l’onde sismique générée à la source, de la loi d’atténuation dans le sol et de la distance [1,5,6].
Enfin, lorsqu’on se base sur le travail d’autres auteurs, on se doit de rapporter et d’utiliser ce travail avec exactitude et rigueur. Par exemple, les auteurs Souriau et al. [4] n’ont donné aucune information sur la durée des « bangs », contrairement à ce que rapporte Joets dans son introduction, sans préciser d’où il tient ces valeurs. Ils n’ont émis qu’une hypothèse de travail, avec un critère pour la tester, contrairement à ce qu’affirme le résumé anglais. De même, dans [4], les auteurs ont donné la vitesse apparente des ondes enregistrées à l’OMP à 4,2 km de la source de l’explosion (v = 2,7 km/s pour la première arrivée, v = 1,8 km/s pour une onde tardive horizontale, qui donc ne peut être à l’origine d’un son), mais ils n’ont pas donné de valeur valable à toute distance, ce que sous-entend l’utilisation qu’en fait Joets. Par ailleurs, Joets s’appuie (Fig. 1a) sur un document non public [3] dans lequel les auteurs donnent la différence de temps approximative (croissant linéairement avec la distance) attendue entre les deux sons dans l’hypothèse 2, pour des distances comprises entre 0 et 6 km. Joets extrapole la droite jusqu’à 60 km (Ln(l) = 11), sans préciser le domaine de validité donné par les auteurs (0–6 km). Mentionnons ici que cette extrapolation est évidemment fausse, par suite de la stratification du sol et de l’augmentation des vitesses sismiques avec la profondeur.
Sans remettre en question les quelques témoignages reportés dans l’article de Joets, ni prendre un quelconque parti concernant l’interprétation des manifestations sonores perçues lors de l’explosion de l’usine AZF, nous pensons que le nombre très réduit des témoignages, leur collecte tardive, leur mode de sélection peu explicite, ainsi que le manque de rigueur et les nombreuses imprécisions et incohérences de l’article, affaiblissent considérablement la pertinence des conclusions présentées.