The Prague Post - Pour grandir, l'IA générative se tourne vers les livres

EUR -
AED 4.232344
AFN 81.239797
ALL 98.413639
AMD 441.954506
ANG 2.062221
AOA 1056.634125
ARS 1571.150714
AUD 1.788673
AWG 2.076971
AZN 1.963437
BAM 1.974127
BBD 2.325792
BDT 140.818142
BGN 1.950821
BHD 0.43438
BIF 3390.561252
BMD 1.152272
BND 1.495685
BOB 7.959897
BRL 6.400647
BSD 1.151995
BTN 100.748313
BWP 15.803716
BYN 3.769697
BYR 22584.537141
BZD 2.313881
CAD 1.590752
CDF 3330.067373
CHF 0.930506
CLF 0.028451
CLP 1116.1375
CNY 8.309962
CNH 8.296735
COP 4755.347136
CRC 582.003118
CUC 1.152272
CUP 30.535216
CVE 110.560981
CZK 24.586081
DJF 204.782287
DKK 7.462623
DOP 70.009948
DZD 150.953786
EGP 56.085361
ERN 17.284085
ETB 158.898459
FJD 2.612951
FKP 0.871538
GBP 0.871377
GEL 3.115584
GGP 0.871538
GHS 12.103302
GIP 0.871538
GMD 83.544179
GNF 9995.962639
GTQ 8.841155
GYD 240.997337
HKD 9.045343
HNL 30.271026
HRK 7.536442
HTG 150.799976
HUF 398.5023
IDR 18885.051685
ILS 3.933783
IMP 0.871538
INR 100.503541
IQD 1509.476717
IRR 48525.071763
ISK 142.974392
JEP 0.871538
JMD 184.775392
JOD 0.817007
JPY 170.376716
KES 149.223643
KGS 100.766656
KHR 4626.373701
KMF 497.20987
KPW 1037.022348
KRW 1603.133852
KWD 0.352008
KYD 0.959911
KZT 625.153714
LAK 24866.036704
LBP 103185.985147
LKR 347.072099
LRD 231.607134
LSL 20.752864
LTL 3.402361
LVL 0.696998
LYD 6.2396
MAD 10.490332
MDL 19.836152
MGA 5228.539982
MKD 62.136857
MMK 2418.008591
MNT 4138.311883
MOP 9.313261
MRU 45.883919
MUR 53.869166
MVR 17.749301
MWK 2000.92516
MXN 21.824994
MYR 4.928849
MZN 73.699771
NAD 21.100692
NGN 1765.869261
NIO 42.393567
NOK 11.862303
NPR 161.197503
NZD 1.955855
OMR 0.443036
PAB 1.151894
PEN 4.138218
PGK 4.852045
PHP 66.60484
PKR 326.381561
PLN 4.272833
PYG 8628.100341
QAR 4.195136
RON 5.070118
RSD 117.150417
RUB 92.180184
RWF 1659.272117
SAR 4.322265
SBD 9.499521
SCR 16.29756
SDG 691.943754
SEK 11.19879
SGD 1.488494
SHP 0.905505
SLE 26.502653
SLL 24162.578608
SOS 658.527841
SRD 42.450138
STD 23849.710246
STN 24.729581
SVC 10.079399
SYP 14981.834749
SZL 21.094837
THB 37.513421
TJS 10.868197
TMT 4.044476
TND 3.426611
TOP 2.698741
TRY 46.841748
TTD 7.807482
TWD 34.296276
TZS 2914.801889
UAH 48.152092
UGX 4129.335341
USD 1.152272
UYU 46.276604
UZS 14619.773408
VES 142.560944
VND 30212.579788
VUV 138.432431
WST 3.193915
XAF 662.103745
XAG 0.031243
XAU 0.000344
XCD 3.114074
XCG 2.076074
XDR 0.798997
XOF 662.060249
XPF 119.331742
YER 277.294748
ZAR 20.869039
ZMK 10371.837585
ZMW 26.349621
ZWL 371.031211
  • AEX

    -17.2300

    884.87

    -1.91%

  • BEL20

    -70.9400

    4565.37

    -1.53%

  • PX1

    -226.1700

    7546.16

    -2.91%

  • ISEQ

    -312.6300

    11097.34

    -2.74%

  • OSEBX

    -19.8300

    1605.43

    -1.22%

  • PSI20

    -84.8300

    7626.71

    -1.1%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -65.7500

    3221.76

    -2%

  • N150

    -54.9400

    3607.69

    -1.5%

Pour grandir, l'IA générative se tourne vers les livres
Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

A.Slezak--TPP