The Prague Post - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

EUR -
AED 4.313565
AFN 79.123718
ALL 96.942304
AMD 449.964277
ANG 2.10293
AOA 1077.068973
ARS 1733.746257
AUD 1.780981
AWG 1.65172
AZN 2.001409
BAM 1.955645
BBD 2.368612
BDT 143.118638
BGN 1.955645
BHD 0.443465
BIF 3509.921346
BMD 1.174557
BND 1.51028
BOB 8.126355
BRL 6.257456
BSD 1.176007
BTN 103.550779
BWP 15.665756
BYN 3.982084
BYR 23021.312332
BZD 2.365212
CAD 1.618716
CDF 3316.948692
CHF 0.92314
CLF 0.028606
CLP 1122.220907
CNY 8.355097
CNH 8.362363
COP 4581.536271
CRC 593.252902
CUC 1.174557
CUP 31.125754
CVE 110.256247
CZK 24.289134
DJF 209.423374
DKK 7.463961
DOP 72.914211
DZD 152.200286
EGP 55.910561
ERN 17.618351
ETB 168.7896
FJD 2.644872
FKP 0.871076
GBP 0.861459
GEL 3.175838
GGP 0.871076
GHS 14.430854
GIP 0.871076
GMD 86.917617
GNF 10201.190125
GTQ 9.008285
GYD 246.040467
HKD 9.132943
HNL 30.822553
HRK 7.534199
HTG 153.877784
HUF 390.427164
IDR 19549.028935
ILS 3.918562
IMP 0.871076
INR 103.479042
IQD 1540.677685
IRR 49404.797848
ISK 143.002738
JEP 0.871076
JMD 188.585028
JOD 0.832807
JPY 173.746354
KES 151.877942
KGS 102.715439
KHR 4726.624752
KMF 490.965134
KPW 1057.100167
KRW 1641.102889
KWD 0.358722
KYD 0.980022
KZT 636.629458
LAK 25461.978567
LBP 105312.539211
LKR 355.601769
LRD 209.923334
LSL 20.40328
LTL 3.468161
LVL 0.710478
LYD 6.342496
MAD 10.608658
MDL 19.510451
MGA 5199.587203
MKD 61.530115
MMK 2465.496648
MNT 4225.694365
MOP 9.419052
MRU 47.041265
MUR 53.266593
MVR 17.97511
MWK 2039.238104
MXN 21.617134
MYR 4.941406
MZN 75.058557
NAD 20.40328
NGN 1756.644029
NIO 43.276564
NOK 11.675569
NPR 165.680847
NZD 1.985223
OMR 0.451622
PAB 1.176007
PEN 4.096675
PGK 4.91561
PHP 66.886901
PKR 333.724905
PLN 4.263727
PYG 8374.335159
QAR 4.275961
RON 5.075852
RSD 117.150699
RUB 98.182205
RWF 1704.664666
SAR 4.405169
SBD 9.627676
SCR 17.900779
SDG 706.500204
SEK 11.053641
SGD 1.507078
SHP 0.923017
SLE 27.371479
SLL 24629.872108
SOS 672.046646
SRD 44.746506
STD 24310.953338
STN 24.498055
SVC 10.290183
SYP 15271.347995
SZL 20.40538
THB 37.403804
TJS 11.007526
TMT 4.110949
TND 3.421528
TOP 2.750934
TRY 48.533117
TTD 7.959368
TWD 35.508069
TZS 2901.86962
UAH 48.583443
UGX 4118.673018
USD 1.174557
UYU 46.976271
UZS 14481.850282
VES 191.972897
VND 30987.7435
VUV 139.949809
WST 3.137227
XAF 655.904928
XAG 0.027266
XAU 0.000319
XCD 3.174299
XCG 2.119432
XDR 0.815735
XOF 655.904928
XPF 119.331742
YER 281.248041
ZAR 20.369493
ZMK 10572.424443
ZMW 27.806792
ZWL 378.206795
  • AEX

    -3.3600

    929.94

    -0.36%

  • BEL20

    10.8100

    4709.11

    +0.23%

  • PX1

    -0.7900

    7853.59

    -0.01%

  • ISEQ

    -35.8800

    11176.65

    -0.32%

  • OSEBX

    -5.6100

    1645.65

    -0.34%

  • PSI20

    -21.6300

    7704.09

    -0.28%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    33.2300

    3494.96

    +0.96%

  • N150

    -13.5900

    3659.77

    -0.37%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

G.Turek--TPP