The Prague Post - L'intoxication des données, la menace invisible qui cible les chatbots IA

EUR -
AED 4.210618
AFN 73.378016
ALL 94.569878
AMD 421.465916
ANG 2.052746
AOA 1052.512333
ARS 1663.642959
AUD 1.634988
AWG 2.066615
AZN 1.917679
BAM 1.955642
BBD 2.308513
BDT 140.688622
BGN 1.938641
BHD 0.432254
BIF 3417.823599
BMD 1.146527
BND 1.47978
BOB 7.920394
BRL 5.920786
BSD 1.146207
BTN 108.048435
BWP 15.576333
BYN 3.184742
BYR 22471.934685
BZD 2.305124
CAD 1.622611
CDF 2637.012921
CHF 0.924881
CLF 0.026218
CLP 1031.622112
CNY 7.761191
CNH 7.783831
COP 3951.460409
CRC 519.957951
CUC 1.146527
CUP 30.382973
CVE 110.257045
CZK 24.227555
DJF 204.104384
DKK 7.474786
DOP 66.994582
DZD 153.043079
EGP 57.234527
ERN 17.197909
ETB 181.41802
FJD 2.575387
FKP 0.866674
GBP 0.86654
GEL 3.044059
GGP 0.866674
GHS 12.837018
GIP 0.866674
GMD 83.125684
GNF 10041.187965
GTQ 8.743293
GYD 239.761656
HKD 8.987358
HNL 30.66052
HRK 7.536927
HTG 149.717892
HUF 352.73943
IDR 20416.383251
ILS 3.396705
IMP 0.866674
INR 108.197607
IQD 1501.478575
IRR 1576761.641307
ISK 143.85439
JEP 0.866674
JMD 181.105354
JOD 0.812861
JPY 184.870683
KES 148.418068
KGS 100.264126
KHR 4596.508006
KMF 494.153364
KPW 1031.874953
KRW 1754.611072
KWD 0.353142
KYD 0.955098
KZT 559.34013
LAK 25313.063312
LBP 102638.847161
LKR 382.529065
LRD 208.60313
LSL 18.900572
LTL 3.385397
LVL 0.693523
LYD 7.310409
MAD 10.678836
MDL 20.240833
MGA 4825.630794
MKD 61.660668
MMK 2407.160628
MNT 4104.078481
MOP 9.253552
MRU 45.743301
MUR 54.884428
MVR 17.658804
MWK 1987.447941
MXN 19.882365
MYR 4.743417
MZN 73.274677
NAD 18.900572
NGN 1564.620224
NIO 42.176589
NOK 11.105841
NPR 172.882019
NZD 1.996895
OMR 0.440841
PAB 1.146212
PEN 3.878786
PGK 5.023594
PHP 69.63491
PKR 318.832316
PLN 4.261757
PYG 7038.492184
QAR 4.178299
RON 5.239859
RSD 117.41198
RUB 83.891655
RWF 1679.020284
SAR 4.298324
SBD 9.239056
SCR 15.647396
SDG 688.488856
SEK 10.97347
SGD 1.48031
SHP 0.855998
SLE 28.376814
SLL 24042.107996
SOS 655.047026
SRD 42.844614
STD 23730.799864
STN 24.498019
SVC 10.029189
SYP 126.728065
SZL 18.895472
THB 37.680622
TJS 10.630687
TMT 4.012845
TND 3.386926
TOP 2.760563
TRY 53.250915
TTD 7.772405
TWD 36.242074
TZS 3009.667324
UAH 51.490236
UGX 4171.662636
USD 1.146527
UYU 45.826294
UZS 13810.883108
VES 695.520894
VND 30176.598006
VUV 136.03008
WST 3.155018
XAF 655.903957
XAG 0.017705
XAU 0.000276
XCD 3.098547
XCG 2.065633
XDR 0.806808
XOF 655.909677
XPF 119.331742
YER 271.870251
ZAR 18.891562
ZMK 10320.117783
ZMW 20.545428
ZWL 369.181316
  • AEX

    -2.7000

    1078.69

    -0.25%

  • BEL20

    -10.7300

    5638.25

    -0.19%

  • PX1

    -35.5700

    8432.7

    -0.42%

  • ISEQ

    -68.9300

    13717.6

    -0.5%

  • OSEBX

    22.1700

    1949.6

    +1.15%

  • PSI20

    4.5200

    9045.3

    +0.05%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -88.3500

    4200.66

    -2.06%

  • N150

    -0.4200

    4231.96

    -0.01%

L'intoxication des données, la menace invisible qui cible les chatbots IA
L'intoxication des données, la menace invisible qui cible les chatbots IA / Photo: Nicolas TUCAT - AFP/Archives

L'intoxication des données, la menace invisible qui cible les chatbots IA

Le recours aux agents conversationnels basés sur l'intelligence artificielle occupe une place croissante dans le rapport des utilisateurs à l'information. Mais aux biais et aux erreurs des "chatbots" s'ajoute la menace de manipulation des données sur lesquels ils sont entraînés.

Taille du texte:

. L'IA, cible de choix

ChatGPT, Mistral, Claude ou Gemini... Prisés des utilisateurs pour leur rapidité et leur facilité d'utilisation, les "chatbots" IA sont entraînés à formuler leurs réponses à partir de gigantesques bases de données regroupant des milliards de documents, inlassablement compilés et archivés par des "robots" qui parcourent internet en quête de données.

Il y apprennent comment, statistiquement, les mots s'enchaînent pour former des phrases et des idées, afin de pouvoir ensuite générer des réponses cohérentes qui ont le plus de chances de correspondre à la requête de l'usager.

Mais ce mode de collecte et d'entraînement expose les "chatbots" à de possibles manipulations par des acteurs malveillants, susceptibles d'introduire dans leurs données d'entraînement des éléments indésirables comme de la désinformation, de la propagande ou du code informatique malveillant.

. Empoisonnement, conditionnement

Chercheurs au Laboratoire d'investigation numérique de l'Atlantic council, un think tank d'étude des relations internationales, Valentin Châletet et Esteban Ponce de León distinguent deux concepts:

L'empoisonnement de données des grands modèles de langage (LLM) sur lesquels reposent les chatbots ("LLM poisoning") se produit en amont, lors de l'entraînement, via l'injection d'éléments non désirés. Ces manipulations sont pensées pour contourner les mécanismes de filtrage mis en place par les entreprises pour garantir des données fiables.

Le conditionnement ("LLM grooming") intervient plus tard, alors que le chatbot est déjà déployé: des acteurs malveillants diffusent massivement du contenu en ligne pour qu'il soit intégré par les modèles IA.

Ainsi, des tests menés par l'entreprise d'analyse de la fiabilité des contenus en ligne Newsguard ont montré que, dans diverses circonstances, les principaux chabots commerciaux pouvaient répondre en s'appuyant sur de fausses informations du réseau Pravda, une nébuleuse de sites web destinés à amplifier la propagande prorusse.

Ces manipulations peuvent être difficiles à repérer et endiguer, notamment parce que le fonctionnement de ces modèles est volontairement rendu opaque par leurs concepteurs: "On a affaire à un réseau de neurones qui fonctionne comme une boîte noire", explique Valentin Châtelet.

Expurger les données en question nécessiterait le plus souvent un réentraînement complet du modèle, estime le chercheur, et présenterait "un coût extrême" en temps et en ressources. La complexité de ces systèmes algorithmiques rend également très ardus leur audit ou leur régulation.

. "Désinformation à la demande"

Le phénomène est difficile à mesurer et son impact sur les utilisateurs complexe voire impossible à démontrer. Mais, difficilement traçables et relativement peu coûteuses, ces opérations ont de quoi séduire les acteurs qui souhaiteraient promouvoir leurs narratifs, qu'il s'agisse d'Etats, de lobbies ou d'entreprises.

"Ce type d'opération pourrait être mené par un groupe industriel qui veut enterrer les résultats d'une étude médicale scientifique qui ne va pas dans leur sens, par un homme politique qui veut pousser un récit qui va servir sa campagne...", énumère Chine Labbé, rédactrice en chef française de Newsguard.

Esteban Ponce de León observe pour sa part le développement d'un écosystème de "désinformation à la demande", au sein duquel des Etats ou des entités "délègueraient (...) l'opération à une autre entité, probablement privée, qui dispose déjà de l'expertise technologique nécessaire pour mener à bien" une campagne d'influence visant les LLM.

En septembre 2025, une entreprise dirigée par l'ancien directeur de campagne de Donald Trump a ainsi reçu plusieurs millions de dollars d'entreprises liées à l'Etat israélien pour diffuser des éléments de langage favorables via un réseau de sites web, avec pour objectif notamment d'influencer les réponses des chatbots, selon le think tank américain Quincy Institute for Responsible Statecraft.

Face au risque, les entreprises d'IA sont les premières concernées: il est ainsi crucial d'"apprendre aux chatbots à distinguer et à ne pas pondérer de la même manière les sources fiables et les sources de propagande étrangère ou de désinformation", argue Chine Labbé.

D.Kovar--TPP