The Prague Post - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.284449
AFN 77.730957
ALL 96.630776
AMD 448.903604
ANG 2.088246
AOA 1069.799328
ARS 1696.311063
AUD 1.79287
AWG 2.102849
AZN 1.97906
BAM 1.955824
BBD 2.354519
BDT 142.381753
BGN 1.956903
BHD 0.440707
BIF 3445.527662
BMD 1.166629
BND 1.513512
BOB 8.078065
BRL 6.328266
BSD 1.169009
BTN 102.897826
BWP 15.665193
BYN 3.982315
BYR 22865.93558
BZD 2.351119
CAD 1.634623
CDF 2572.417538
CHF 0.925417
CLF 0.028583
CLP 1121.305866
CNY 8.314626
CNH 8.314422
COP 4499.351143
CRC 586.809741
CUC 1.166629
CUP 30.915678
CVE 110.265885
CZK 24.299665
DJF 208.171671
DKK 7.468055
DOP 73.931227
DZD 150.851858
EGP 55.374869
ERN 17.49944
ETB 173.75054
FJD 2.65274
FKP 0.867581
GBP 0.868351
GEL 3.155161
GGP 0.867581
GHS 12.537101
GIP 0.867581
GMD 83.997258
GNF 10144.124919
GTQ 8.954072
GYD 244.531963
HKD 9.061164
HNL 30.702378
HRK 7.535377
HTG 153.311231
HUF 389.397333
IDR 19345.398141
ILS 3.861351
IMP 0.867581
INR 102.676042
IQD 1531.412295
IRR 49071.345289
ISK 141.803504
JEP 0.867581
JMD 187.872314
JOD 0.827114
JPY 176.016384
KES 150.984762
KGS 102.021584
KHR 4705.037775
KMF 492.91301
KPW 1049.966726
KRW 1657.978972
KWD 0.35679
KYD 0.974208
KZT 628.875049
LAK 25366.986221
LBP 104684.537787
LKR 353.932842
LRD 213.921717
LSL 20.384889
LTL 3.444754
LVL 0.705682
LYD 6.345051
MAD 10.689986
MDL 19.714989
MGA 5200.064036
MKD 61.620759
MMK 2449.489233
MNT 4195.591091
MOP 9.352075
MRU 46.750776
MUR 52.532844
MVR 17.849078
MWK 2027.024962
MXN 21.428239
MYR 4.930188
MZN 74.559531
NAD 20.385064
NGN 1714.338303
NIO 43.02053
NOK 11.725617
NPR 164.637027
NZD 2.03347
OMR 0.447484
PAB 1.169009
PEN 3.958249
PGK 4.986061
PHP 67.814994
PKR 330.931357
PLN 4.242623
PYG 8297.137734
QAR 4.261034
RON 5.087442
RSD 117.171443
RUB 94.899542
RWF 1696.820895
SAR 4.375216
SBD 9.60996
SCR 16.237181
SDG 701.722208
SEK 10.984747
SGD 1.510411
SHP 0.875274
SLE 26.97211
SLL 24463.633948
SOS 668.108227
SRD 45.983886
STD 24146.872467
STN 24.500302
SVC 10.229082
SYP 15168.374672
SZL 20.378164
THB 38.230235
TJS 10.783987
TMT 4.083203
TND 3.413327
TOP 2.732363
TRY 48.945702
TTD 7.929064
TWD 35.728
TZS 2878.610099
UAH 48.789801
UGX 4086.032805
USD 1.166629
UYU 46.800376
UZS 14216.175063
VES 234.74642
VND 30734.267341
VUV 142.385017
WST 3.277055
XAF 655.965078
XAG 0.022376
XAU 0.000274
XCD 3.152874
XCG 2.106817
XDR 0.81581
XOF 655.962266
XPF 119.331742
YER 278.706461
ZAR 20.240437
ZMK 10501.061884
ZMW 26.507213
ZWL 375.65418
  • AEX

    -3.1600

    955.86

    -0.33%

  • BEL20

    -47.6000

    4963.34

    -0.95%

  • PX1

    -14.7400

    8174.2

    -0.18%

  • ISEQ

    -213.2200

    11438.22

    -1.83%

  • OSEBX

    -20.7100

    1623.18

    -1.26%

  • PSI20

    -75.0700

    8266.08

    -0.9%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -28.1000

    3985.67

    -0.7%

  • N150

    -39.5900

    3660.75

    -1.07%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

A.Slezak--TPP