À la recherche des génomes qui fleurissent les jardins de France : le séquençage du rosier (2012-2018)
La réalisation du séquençage du rosier, publié en 2018, est une avancée majeure de l’histoire du rosier cultivé. Il s’agit d’une réussite internationale dans laquelle la recherche française a joué le rôle de chef de file. Le rosier est la troisième plante ornementale séquencée, après l’œillet en 2013 et la tulipe en 2017.
Pour comprendre en quoi le séquençage du génome du rosier constitue une avancée, il faut répondre à trois questions simples. En quoi cela consiste-t-il ? Comment les recherches sur le rosier se sont-elles déroulées ? En quoi est-ce utile pour cultiver les rosiers ? À la dernière question, Jardins de France a déjà répondu en 2014 (1*).
Un aperçu du séquençage du génome
Le génome est l’ensemble complet du matériel génétique (gènes et séquences non codantes d’ADN) contenu dans chaque cellule d’un organisme. Le séquençage (2*) est la technique qui détermine l’ordre des nucléotides d’un fragment d’ADN ou de la totalité de l’ADN et permet de déchiffrer l’ensemble de l’information génétique qu’il contient. C’est-à-dire d’annoter la totalité des gènes codant pour les protéines nécessaires à l’organisme. Le séquençage du génome est donc une sorte de dissection. Elle consiste à découper des chromosomes en morceaux, à identifier les molécules codées puis à rassembler les morceaux jusqu’à ce qu’ils couvrent la totalité de chacun des chromosomes.
Deux approches techniques combinées
Malgré la puissance des séquenceurs, il n’est pas possible de séquencer en une seule opération des molécules de la taille d’un génome. C’est pour cette raison qu’il faut découper l’ADN en morceaux par des méthodes physiques (sonication (3*). Les cassures de la molécule s’effectuant au hasard, les fragments ne peuvent être à nouveau assemblés que par le chevauchement des extrémités. D’où la nécessité de disposer d’un nombre de séquences chevauchantes correspondant à une redondance des parties du génome dont le total équivaut à plusieurs fois sa longueur. Il existe deux stratégies couplées au séquençage. Le séquençage par ordonnancement hiérarchique coupe chaque chromosome en fragments pour pouvoir les réassembler d’après une carte physique du génome et le séquençage aléatoire d’un génome complet (shotgun), dit aussi « global », qui séquence les fragments dans un ordre aléatoire et les ordonne ensuite avec des logiciels de calcul appelés assembleurs. La carte physique représente l’alignement des fragments chevauchants dans l’ordre qu’ils occupent le long de la molécule d’ADN. C’est à partir de cette carte que peut être choisi un ensemble minimum de fragments avec lesquels il est possible d’assurer la couverture complète du génome ; les distances sont mesurées en paires de bases chimiques (pb). Concrètement, on coupe chaque chromosome en fragments, on les clone en nombre suffisant pour effectuer les chevauchements nécessaires et on les oriente à l’aide de marqueurs moléculaires (4*). Suit le séquençage, par ordonnancement hiérarchique ou aléatoire du génome, après lequel les fragments sont assemblés dans l’ordre indiqué par les marqueurs dont on connaît l’emplacement. L’assemblage étant complet, l’ordonnancement des fragments est vérifié.
Un même rosier, deux consortiums et un génome qui s’affine
À l’origine, en 2012, un programme commun a été mené sous le nom de Groupe national Rose. Le rosier cultivé étant très hétérozygote, il s’agissait de créer un rosier à génome simple. Cela a été réalisé avec la culture in vitro de cellules haploïdes (issues d’anthères ou d’ovules), suivie d’une diploïdisation (5*) pour produire une lignée homozygote pure. La variété retenue est un rosier asiatique anciennement introduit en Europe : R. chinensis ‘Old Blush’6. Son rôle à l’origine des hybrides de thé et sa diploïdie, qui limite à sept paires le nombre de chromosomes à séquencer, le désignaient. Deux projets ont ensuite été poursuivis par des consortiums internationaux, l’un sous la conduite du Laboratoire de reproduction et développement des plantes de l’École normale supérieure (ENS-Lyon, Mohammed Bendahmane, directeur de recherche Inrae), l’autre par un laboratoire Inra des Pays de la Loire (Institut de recherche en horticulture et semences, Fabrice Foucher, directeur de recherche Inrae), à Angers. Les deux projets se distinguent peu l’un de l’autre, si ce n’est dans le choix des méthodes pour affiner le génome séquencé. Le consortium de Lyon utilise des méthodes résolument génomiques reposant sur l’usage d’algorithmes pour aligner les fragments d’ADN séquencés. Le consortium d’Angers a, pour sa part, recours à des méthodes plus génétiques combinant le séquençage global et la cartographie classique, permettant d’attribuer aux séquences l’emplacement qu’elles occupent physiquement sur le chromosome.
Consortium de Lyon, entre origine, floraison, fragrance ou teintes
En avril 2018, après huit ans de travail, la réalisation du séquençage est annoncée dans un article de la revue américaine Nature Genetics. Après avoir analysé les sept paires de chromosomes de R. chinensis ´Old Blush´, le consortium est parvenu à décrypter 503 Mb de son ADN, sur un total évalué à 560 Mb, et à séquencer 36 377 gènes. L’approche a consisté à coupler un séquençage d’ADN simple molécule en temps réel (SMRT) de brins courts et longs et un méta assemblage (7*). Le séquenceur était un robot à haut débit de type PacBio (8*), avec lequel on peut produire des longues séquences, ce qui permet de réduire le nombre des erreurs de chevauchement. Quant à la carte génétique qui a servi de référence, il s’agissait d’une carte déjà publiée en 2012, obtenue à partir de la descendance d’un rosier fleurs coupées identifié ‘K5’ (9*). Les résultats de plusieurs recherches qui se sont déroulées dans le cadre du projet ont aussi conduit à dater aux temps paléontologiques l’évolution du rosier vers les formes modernes, avec une contribution importante de trois sections du genre Rosa : Synstylae, Chinenses et Cinnamomeae. Ces travaux ont aussi apporté des éclaircissements sur l’évolution de la famille des Rosaceae, d’où il est ressorti que le fraisier, le framboisier et le rosier seraient génétiquement très proches (10*). Le séquençage de quatorze autres rosiers a permis en outre d’identifier la provenance de plusieurs traits d’intérêt du rosier et l’origine mosaïque du cultivar ‘La France’ (1867). Enfin, des candidats pour les principaux gènes impliqués dans la floraison, le développement de la fleur, la reproduction, la fragrance et la synthèse des pigments à l’origine des teintes rouges (famille des anthocyanes), ainsi que leurs voies de biosynthèse ont pu être identifiés.
À Angers, le gène responsable de la duplicature identifié
En juin 2018, un second génome complet, dit de haute qualité, a été publié dans la revue Nature Plants. Le rosier séquencé est le R. chinensis ´Old Blush´ issu d’une lignée homozygote. Ce sont 512 Mb de l’ADN qui sont décryptés. Selon les techniques de mesure, la longueur totale du génome s’élèverait à 532,7 Mb ou à 568 Mb. La méthode de séquençage a été la même que précédemment mais, pour l’assemblage, le consortium d’Angers s’est servi principalement d’une carte génétique (11*) haute densité issue du croisement entre R. chinensis ‘Old Blush’ et un hybride R. wichurana (12*). Cette séquence a été validée en utilisant deux autres descendances : ‘K5’ et une autre issue d’un croisement entre ‘Yesterday’ (13*) et R. wichurana. Les séquences des fragments ont été finalement ancrées sur les positions indiquées par les marqueurs sur les trois cartes physiques pour reconstituer les sept chromosomes représentant l’ensemble complet du matériel génétique du rosier, autrement dit son génome. L’analyse a été complétée par la caractérisation de loci impliqués dans le contrôle de la duplicature, de la présence d’aiguillons, de la remontée de floraison et de l’incompatibilité gamétophytique.
Jean Claude Brodbeck
Membre de la SNHF
Remerciements à Fabrice Foucher, directeur de recherche à l’Inrae
pour sa relecture attentive et à qui nous exprimons notre vive
gratitude.
(1*) Caissard, J.-C. « Le séquençage du génome: pourquoi faire? » Cahiers de Jardins de France (SNHF) n° 1 (2014). Disponible sur: www.jardinsdefrance.org/le-sequencage-du-genome-du-rosier-pourquoi-faire/
(2*) L’ADN est constitué d’un enchaînement de nucléotides. Ces derniers sont des composés chimiques de plusieurs molécules simples (monomères), dont une partie variable est une base chimique. Le nombre de bases sert à exprimer la taille d’une séquence et s’exprime en millions de bases (Mb).
(3*) Rupture des molécules d’ADN au moyen d’ondes sonores à haute fréquence (ultrasons). Avec l’automatisation des manipulations et le développement des plateaux de séquençage, la sonication a remplacé la technique des enzymes de restriction dont on se sert comme de ciseaux.
(4*) Les marqueurs moléculaires sont des marqueurs révélant des variations se produisant à un emplacement spécifique (locus) sur un chromosome.
(5*) Opération de reproduction artificielle consistant à régénérer un organisme à partir de cellules haploïdes (mâles ou femelles) et à provoquer ensuite le doublement du nombre chromosomique pour obtenir un individu diploïde.
(6*) L’introduction de ce rosier est mal documentée. Dénommé ‘Old Blush’ au XXe siècle, on le retrouve sous différents noms dans les sources historiques : ‘Rosier de l’Inde’, ‘Bengale rose’ ou, en anglais, de ‘Parsons Pink China’.
(7*) Le méta-assemblage est une combinaison de plusieurs assemblages d’un même génome réalisés par différentes méthodes et les données des séquences qui ont été utilisées.
(8*) Le séquenceur PacBio RS II se caractérise par la masse des opérations réalisées en parallèle. Il appartient à la génération qu’on appelle séquençage de nouvelle génération (NGS d’après l’anglais Next Generation Sequencing ou, encore, de 3e génération). Grâce à ce type d’appareil, il est maintenant possible de séquencer de centaines de milliers de fragments simultanément et d’assembler des séquences longues, d’une précision élevée. On dit que le séquençage est réalisé en temps réel parce qu’il se réalise au fur et à mesure de la séquence à décrypter. L’assembleur utilisé était de type Canu.
(9*) La descendance F1 tétraploïde K5 a été étudiée à plusieurs reprises depuis 2006 et le rosier a fait l’objet de travaux de cartographie qui ont permis de localiser 25695 marqueurs correspondant à des variations alléliques (2017).
(10*) Il s’agit d’une synténie qui se produit quand des groupes de liaison de gènes sont conservés entre les génomes de deux espèces.
(11*) Une carte génétique est une représentation des chromosomes sous forme de groupes de liaison (groupes formés de gènes liés et qui tendent à être hérités ensemble). Les distances représentent les fréquences des recombinaisons se produisant entre les chromosomes homologues au cours de la méiose.
(12*) Hybride dans lequel 6746 marqueurs ont été localisés.
(13*) Yesterday’ Harkness, 1974. Rosier moderne, Groupe des ‘Polyantha’.
BIBLIOGRAPHIE
Bourke PM et al. Partial Preferential Chromosome Pairing is Genotype Dependent in Tetraploïd Rose. The Plant Journal 50 (2017). Disponible sur: https://doi.org/10.1111/tpj.13496 Hibrand Saint-Oyant L et al. A High-Quality Genome Sequence of Rosa Chinensis to Elucidate Ornamental Traits. Nature Plants, 54 (2018), p. 473-484. Disponible sur: https://doi.org/10.1038/s41477-018-0166-1
Raymond O et al. The Rosa Genome Provides New Insights into the Domestication of Modern Roses. Nature Genetics 50 (2018), p. 772-777. Disponible sur: https://doi.org/10.1038/s41588-018-0110-3
Le Guyader H. La Rose dévoile son génome (2019). Pour la Science, 498, p.92-94