The Prague Post - Un pas de plus dans l'interprétation du génome grâce à l'IA

EUR -
AED 4.385233
AFN 77.61497
ALL 96.381042
AMD 452.143941
ANG 2.137486
AOA 1094.965307
ARS 1724.839952
AUD 1.705709
AWG 2.150824
AZN 2.023326
BAM 1.950382
BBD 2.403792
BDT 145.842406
BGN 2.00529
BHD 0.450137
BIF 3535.334404
BMD 1.194073
BND 1.505997
BOB 8.247158
BRL 6.220643
BSD 1.19347
BTN 109.627454
BWP 15.616552
BYN 3.39343
BYR 23403.827993
BZD 2.400352
CAD 1.6217
CDF 2674.723408
CHF 0.918953
CLF 0.026089
CLP 1030.123768
CNY 8.304359
CNH 8.294925
COP 4394.188113
CRC 592.347015
CUC 1.194073
CUP 31.642931
CVE 109.958154
CZK 24.295979
DJF 212.210937
DKK 7.466561
DOP 75.090455
DZD 154.405125
EGP 55.911983
ERN 17.911093
ETB 185.584399
FJD 2.62499
FKP 0.866453
GBP 0.865846
GEL 3.217952
GGP 0.866453
GHS 13.044871
GIP 0.866453
GMD 87.167473
GNF 10472.774994
GTQ 9.15641
GYD 249.695299
HKD 9.315607
HNL 31.496108
HRK 7.538297
HTG 156.293851
HUF 380.725312
IDR 20019.825517
ILS 3.699088
IMP 0.866453
INR 109.991431
IQD 1563.43712
IRR 50300.31928
ISK 144.805323
JEP 0.866453
JMD 187.087918
JOD 0.846557
JPY 183.369016
KES 154.035258
KGS 104.421911
KHR 4797.672032
KMF 491.958321
KPW 1074.596133
KRW 1713.399287
KWD 0.366162
KYD 0.994637
KZT 601.339474
LAK 25712.78503
LBP 106877.38889
LKR 369.558721
LRD 220.796625
LSL 18.976864
LTL 3.525787
LVL 0.722283
LYD 7.495084
MAD 10.790987
MDL 20.0144
MGA 5325.251011
MKD 61.666321
MMK 2507.53068
MNT 4265.99436
MOP 9.591635
MRU 47.643049
MUR 53.841119
MVR 18.460284
MWK 2069.550773
MXN 20.561528
MYR 4.679547
MZN 76.133729
NAD 18.976944
NGN 1666.173702
NIO 43.917995
NOK 11.498326
NPR 175.40153
NZD 1.978692
OMR 0.459131
PAB 1.193494
PEN 3.993373
PGK 5.108744
PHP 70.249681
PKR 333.873104
PLN 4.203859
PYG 8014.634606
QAR 4.339445
RON 5.09571
RSD 117.414371
RUB 91.454536
RWF 1741.262759
SAR 4.478236
SBD 9.645334
SCR 16.41712
SDG 718.229283
SEK 10.586107
SGD 1.508947
SHP 0.895864
SLE 29.013143
SLL 25039.109895
SOS 680.899902
SRD 45.484624
STD 24714.897312
STN 24.431821
SVC 10.442858
SYP 13205.938189
SZL 18.969066
THB 37.120119
TJS 11.15307
TMT 4.179255
TND 3.413218
TOP 2.875041
TRY 51.831957
TTD 8.100564
TWD 37.496875
TZS 3056.826235
UAH 51.016335
UGX 4273.075686
USD 1.194073
UYU 45.163967
UZS 14439.705001
VES 428.046641
VND 31123.509012
VUV 142.896113
WST 3.254277
XAF 654.1316
XAG 0.010504
XAU 0.000225
XCD 3.227042
XCG 2.150898
XDR 0.812221
XOF 654.128869
XPF 119.331742
YER 284.668585
ZAR 18.969155
ZMK 10748.104272
ZMW 23.720303
ZWL 384.490973
  • AEX

    -4.5100

    997.13

    -0.45%

  • BEL20

    -16.1900

    5380.41

    -0.3%

  • PX1

    -86.4200

    8066.68

    -1.06%

  • ISEQ

    1.3000

    13006.8

    +0.01%

  • OSEBX

    6.8000

    1749.57

    +0.39%

  • PSI20

    9.5200

    8663.41

    +0.11%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -125.5000

    4085.85

    -2.98%

  • N150

    15.2600

    3927.23

    +0.39%

Un pas de plus dans l'interprétation du génome grâce à l'IA
Un pas de plus dans l'interprétation du génome grâce à l'IA / Photo: HO - AFP/Archives

Un pas de plus dans l'interprétation du génome grâce à l'IA

AlphaGenome, outil d'intelligence artificielle (IA) de Google rendu public mercredi, fait un pas de plus dans la compréhension du génome, en analysant comment des portions de l'ADN régulent l'activité des gènes dans la cellule.

Taille du texte:

Le déchiffrage de l'ensemble du génome humain en 2003, "nous a donné le livre de la vie, mais le lire reste un défi", a rappelé Pushmeet Kohli, vice-président de la recherche chez Google DeepMind, à l'occasion de la présentation d'AlphaGenome dans la revue Nature.

"Nous avons le texte" - la succession de 3 milliards de paires de nucléotides A, T, C et G qui composent l'ADN -, mais "comprendre la grammaire (...) et la manière dont cela gouverne la vie constitue la prochaine frontière majeure de la recherche", a-t-il souligné devant la presse.

Seules 2% des séquences d'ADN "codent" directement des protéines, indispensables au fonctionnement des organismes vivants.

Les 98% restants ont un rôle de "chef d'orchestre": elles coordonnent, protègent et régulent l'expression de l'information génétique dans chacune de nos cellules. Ces séquences, appelées "non codantes", contiennent de nombreux variants associés à des maladies.

Ce sont elles qu'étudie AlphaGenome, venant compléter les autres modèles développés par le laboratoire d'IA de Google: AlphaMissense (analyse des séquences codantes de l'ADN), AlphaProteo (conception de protéines) et AlphaFold (prédiction de la structure de protéines, prix Nobel de chimie en 2024).

Le modèle d'apprentissage profond (dans lequel un réseau de neurones apprend à reconnaître automatiquement des motifs complexes) a été entraîné avec des données provenant de grands consortiums publics, qui ont mesuré expérimentalement ces propriétés dans des centaines de types de cellules et de tissus chez l'homme et la souris.

Il est capable d'analyser une longue séquence d'ADN et de "prédire" l'influence de chaque paire de nucléotides sur différents processus biologiques dans la cellule: activer ou réprimer l'expression d'un gène, piloter l'assemblage de l'ARN (une "copie" de l'ADN qui transmet l'information génétique dans la cellule)...

- "Fondamental" mais "pas parfait" -

D'autres modèles existaient déjà. Mais ils devaient faire un compromis entre la longueur des séquences analysées et la finesse de la résolution.

Or, une longue séquence - jusqu'à un million de paires de nucléotides - est "nécessaire pour comprendre l'environnement régulateur complet d'un gène unique", explique Ziga Avsec, un des co-auteurs du projet.

Et la finesse de la résolution permet d'étudier l'effet de variants génétiques en comparant les prédictions de séquences mutées à celles de séquences non mutées.

Autre avancée, AlphaGenome modélise simultanément l'influence de la séquence sur onze processus biologiques, alors que les scientifiques devaient jusqu'à présent utiliser plusieurs modèles.

Cet outil "peut accélérer notre compréhension du génome en aidant à cartographier l'emplacement des éléments fonctionnels et à déterminer leurs rôles au niveau moléculaire", estime Natasha Latysheva, également co-autrice.

"Nous espérons que les chercheurs enrichiront avec davantage de données et de modalités" le modèle, déjà testé par 3.000 scientifiques de 160 pays et désormais disponible en open source pour la recherche non-commerciale, souligne M. Kohli.

"Identifier précisément les différences dans nos génomes qui nous rendent plus ou moins susceptibles de développer des milliers de maladies est une étape clé vers de meilleurs traitements", note Ben Lehner, responsable de la génomique générative et synthétique au Wellcome Sanger Institute de Cambridge.

Le chercheur, qui n'a pas participé au projet mais a testé le modèle, le juge "très performant", mais encore "loin d'être parfait".

"Les modèles d'IA ne sont bons que dans la mesure où les données utilisées pour les entraîner le sont", or la plupart des jeux de données existants "sont trop petits et insuffisamment standardisés", explique-t-il dans une réaction à l'organisme britannique Science Media Center (SMC).

AlphaGenome n'est pas une "solution miracle à toutes les questions biologiques", l'expression des gènes "étant influencée par des facteurs environnementaux complexes", mais il constitue un "outil fondamental", abonde Robert Goldstone, responsable de la génomique au Francis Crick Institute, cité dans le même texte.

Selon lui, ce nouvel outil permettra aux scientifiques "d'étudier et de simuler de manière programmatique les bases génétiques des maladies complexes".

C.Zeman--TPP