The Prague Post - Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

EUR -
AED 4.079135
AFN 77.847477
ALL 98.089421
AMD 430.439404
ANG 1.988435
AOA 1017.854415
ARS 1255.507008
AUD 1.734237
AWG 2.001832
AZN 1.887246
BAM 1.95597
BBD 2.237295
BDT 134.631719
BGN 1.955916
BHD 0.418586
BIF 3296.716636
BMD 1.110587
BND 1.448739
BOB 7.684738
BRL 6.301431
BSD 1.108106
BTN 94.125617
BWP 15.127453
BYN 3.626316
BYR 21767.498681
BZD 2.225794
CAD 1.553889
CDF 3187.383421
CHF 0.933609
CLF 0.027389
CLP 1051.047937
CNY 7.99989
CNH 7.991526
COP 4691.951023
CRC 562.756584
CUC 1.110587
CUP 29.430547
CVE 110.275095
CZK 24.939355
DJF 197.318952
DKK 7.46051
DOP 65.176553
DZD 148.600917
EGP 56.045649
ERN 16.6588
ETB 149.97408
FJD 2.526418
FKP 0.841954
GBP 0.840992
GEL 3.048509
GGP 0.841954
GHS 14.409873
GIP 0.841954
GMD 80.168383
GNF 9600.005483
GTQ 8.525813
GYD 231.925156
HKD 8.659456
HNL 28.708923
HRK 7.530551
HTG 144.98873
HUF 405.122238
IDR 18493.14066
ILS 3.983758
IMP 0.841954
INR 94.816266
IQD 1453.480529
IRR 46922.287164
ISK 146.675148
JEP 0.841954
JMD 176.191671
JOD 0.787741
JPY 164.353498
KES 143.569604
KGS 97.120702
KHR 4448.570089
KMF 480.59857
KPW 999.523002
KRW 1582.638614
KWD 0.341572
KYD 0.9237
KZT 567.048556
LAK 23966.348668
LBP 99305.547157
LKR 331.296973
LRD 221.696149
LSL 20.31768
LTL 3.279273
LVL 0.671782
LYD 6.07447
MAD 10.368408
MDL 19.139183
MGA 4973.299241
MKD 61.508198
MMK 2331.659477
MNT 3969.123451
MOP 8.897159
MRU 43.979357
MUR 50.764919
MVR 17.145905
MWK 1922.215835
MXN 21.750884
MYR 4.818281
MZN 70.888748
NAD 20.319236
NGN 1778.859693
NIO 40.805454
NOK 11.551973
NPR 150.658469
NZD 1.886379
OMR 0.427565
PAB 1.110587
PEN 4.049211
PGK 4.560896
PHP 61.956851
PKR 312.043023
PLN 4.24951
PYG 8856.764336
QAR 4.044681
RON 5.092703
RSD 117.265619
RUB 89.457356
RWF 1586.786583
SAR 4.165593
SBD 9.274342
SCR 15.785334
SDG 666.917688
SEK 10.836316
SGD 1.449604
SHP 0.872747
SLE 25.265698
SLL 23288.4418
SOS 633.500326
SRD 40.202678
STD 22986.90175
SVC 9.698944
SYP 14441.307049
SZL 20.315634
THB 36.896467
TJS 11.550109
TMT 3.887053
TND 3.372899
TOP 2.674027
TRY 43.093783
TTD 7.524569
TWD 33.835469
TZS 2994.141447
UAH 46.047726
UGX 4056.61718
USD 1.110587
UYU 46.397229
UZS 14309.983047
VES 102.968028
VND 28827.688154
VUV 133.240614
WST 3.085815
XAF 655.506453
XAG 0.033526
XAU 0.000341
XCD 2.998585
XDR 0.79982
XOF 655.506454
XPF 119.331742
YER 271.77272
ZAR 20.311086
ZMK 9996.589417
ZMW 29.185921
ZWL 357.608454
  • AEX

    0.0000

    922.05

    0%

  • BEL20

    14.9900

    4425

    +0.34%

  • PX1

    10.2100

    7860.45

    +0.13%

  • ISEQ

    2.2200

    11103.62

    +0.02%

  • OSEBX

    2.8900

    1523.22

    +0.19%

  • PSI20

    70.3900

    7180.99

    +0.99%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    12.3200

    2579.72

    +0.48%

  • N150

    16.3600

    3573.59

    +0.46%

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence

Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.

Taille du texte:

"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.

"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."

A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.

C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.

Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.

"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.

"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."

Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.

"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."

- Tromper les humains -

Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.

"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.

La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.

L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.

Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.

"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."

Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.

"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.

Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."

Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.

Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.

Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.

"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.

Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.

"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."

G.Turek--TPP