Parce que la FBM, ce ne sont pas que les professeur-e-s ordinaires, nous présentons chaque mois un-e jeune chercheur-euse, issu-e des sciences fondamentales ou cliniques, ou un membre du Personnel administratif et technique (PAT). Sous le feu des projecteurs ce mois, Christophe Dessimoz, professeur assistant boursier FNS au sein du Département d'écologie et évolution (DEE) et du Centre intégratif de génomique (CIG) de l'UNIL.
Pouvez-vous résumer votre parcours?
Je voulais faire de la biotechnologie, ce qui n'existait alors pas à l'EPFL, je suis donc allé faire mes études de biologie à l'EPFZ. C'est là également que j'ai effectué mon PhD. Je suis ensuite parti pour l'Angleterre et l'European Bioinformatics Institute (EBI), tout près de Cambridge. C'est en quelque sorte le «CERN de la bioinformatique», un véritable hub scientifique, un endroit idéal pour forger des relations. En 2013, j'ai rejoint l'University College London comme maître de conférences. Une partie de mon équipe est toujours basée là-bas.
Comment définiriez-vous la bioinformatique?
C'est l'utilisation de modèles et de méthodes computationnelles au service du vivant, pour mieux comprendre les mécanismes biologiques. Bien sûr, la biologie a toujours travaillé avec des modèles, mais ceux-ci restaient relativement simples. Alors qu'aujourd'hui, nous avons besoin d'outils capables d'analyser de gros jeux de données: si vous êtes face à 100 millions de séquences d'ADN, comme c'est déjà le cas après le séquençage d'un seul échantillon, vous ne pouvez plus les traiter «manuellement», les charger dans un fichier Excel. Il est devenu nécessaire d'automatiser, en développant, en peaufinant des algorithmes, tout en restant très rigoureux quant à la qualité des données et des analyses - c'est tout l'enjeu de la bioinformatique.
Plus spécifiquement, sur quoi portent vos recherches?
Je m'intéresse notamment à l'histoire phylogénétique des espèces. Autrement dit, peut-on résumer en quelques arborescences seulement l'évolution des espèces? Très schématiquement, nous développons des outils statistiques et bioinformatiques qui nous permettent d'identifier les gènes «correspondants» chez différents organismes, l'homme, la souris ou la levure par exemple. Je prends l'exemple d'une étude publiée aux États-Unis en 2015: des chercheurs ont essayé de remplacer dans la levure des centaines de gènes par leurs gènes humains correspondants. Or, la moitié d'entre eux se sont avérés fonctionnels. Malgré le milliard d'années d'évolution qui les sépare, la moitié de ces gènes avaient conservé leur fonction ancestrale !
Autrement dit, vous cherchez à remonter le temps, à comprendre ce qui s'est passé il y a 500 millions ou un milliard d'années?
Nous cherchons à trouver des ancêtres communs, des «gènes ancestraux», pour comprendre ce qui a changé ou ce qui n'a pas changé, comment ont évolué les gènes chez deux espèces différentes. Ce travail est capital pour la génétique: certes, le séquençage est devenu très bon marché, il est facile de lire l'ADN. Par contre, il est toujours aussi difficile de l'interpréter. Pour prendre une image, le génome équivaut grosso modo à 1'000 tomes de Guerre et paix. C'est déjà beaucoup. Mais dans le cas du génome, ces 1'000 tomes sont dans une langue que nous ne connaissons pas! Et chaque espèce a son propre génome, et donc ses propres 1'000 tomes. Dès lors, la clé pour interpréter ces génomes, c'est de postuler qu'ils ont tous une origine commune. Et comme le démontre le cas de la levure, il n'y a aucun doute là-dessus. Ce n'est donc pas un nouveau livre pour chaque espèce. Nous espérons tirer de ces travaux une compréhension des principes d'évolution qui nous sera très utile, par exemple, pour comprendre l'évolution des virus, à très courte échelle.
Et qu'avez-vous trouvé en venant vous installer à Lausanne?
Avec une quinzaine d'équipes de recherche et le siège de l'Institut Suisse de Bioinformatique (SIB), Lausanne est le pôle helvétique de la biologie computationnelle et un centre incontournable au niveau européen. En particulier, un bon nombre de ressources bioinformatiques développées dans l'Arc lémanique, telles que notre base de données OMA (pour Orthology Matrix Algorithm) qui élucide des liens entre les génomes de milliers d'espèces, sont des références mondiales dans leur domaine. C'est un environnement très stimulant, d'autant plus qu'il y a beaucoup de collaborations entre médecins, biologistes et informaticiens - j'y vois le reflet de la FBM et de sa diversité. Je pense d'ailleurs que la bioinformatique peut jouer un rôle de pont entre disciplines.