The Prague Post - IA generativa recorre a livros para crescer

EUR -
AED 4.152353
AFN 80.369899
ALL 98.473717
AMD 441.346329
ANG 2.037499
AOA 1035.543572
ARS 1323.736623
AUD 1.767616
AWG 2.03491
AZN 1.923485
BAM 1.952908
BBD 2.290687
BDT 137.845839
BGN 1.951692
BHD 0.426367
BIF 3374.387324
BMD 1.130506
BND 1.482298
BOB 7.839389
BRL 6.414827
BSD 1.134515
BTN 95.878995
BWP 15.530723
BYN 3.712768
BYR 22157.910267
BZD 2.278905
CAD 1.560239
CDF 3247.942448
CHF 0.935604
CLF 0.027922
CLP 1071.481323
CNY 8.220302
CNH 8.2341
COP 4796.848421
CRC 573.043671
CUC 1.130506
CUP 29.958399
CVE 110.10193
CZK 24.950609
DJF 202.031668
DKK 7.465011
DOP 66.770222
DZD 150.035794
EGP 57.576539
ERN 16.957584
ETB 152.252428
FJD 2.554321
FKP 0.84381
GBP 0.850536
GEL 3.103215
GGP 0.84381
GHS 16.167055
GIP 0.84381
GMD 80.831439
GNF 9826.229229
GTQ 8.73706
GYD 238.077387
HKD 8.769236
HNL 29.441265
HRK 7.537423
HTG 148.218509
HUF 404.49172
IDR 18739.035154
ILS 4.111314
IMP 0.84381
INR 95.645408
IQD 1486.192251
IRR 47608.418476
ISK 145.688108
JEP 0.84381
JMD 179.603198
JOD 0.801754
JPY 162.825564
KES 146.863686
KGS 98.862646
KHR 4541.213825
KMF 491.203857
KPW 1017.412427
KRW 1616.006953
KWD 0.346498
KYD 0.945487
KZT 582.199988
LAK 24528.562646
LBP 101652.045579
LKR 339.615499
LRD 226.903936
LSL 21.125118
LTL 3.338089
LVL 0.683832
LYD 6.192855
MAD 10.515725
MDL 19.474071
MGA 5037.449993
MKD 61.439004
MMK 2373.374199
MNT 4039.612274
MOP 9.064634
MRU 44.892914
MUR 50.963281
MVR 17.420539
MWK 1967.251532
MXN 22.204357
MYR 4.87757
MZN 72.352773
NAD 21.124932
NGN 1817.242257
NIO 41.747983
NOK 11.77815
NPR 153.406114
NZD 1.906236
OMR 0.435457
PAB 1.13452
PEN 4.159739
PGK 4.632078
PHP 63.144955
PKR 318.770265
PLN 4.279098
PYG 9086.582194
QAR 4.135076
RON 4.978069
RSD 117.026674
RUB 92.884341
RWF 1629.75736
SAR 4.240171
SBD 9.452494
SCR 16.15212
SDG 678.866525
SEK 10.946466
SGD 1.48003
SHP 0.8884
SLE 25.763995
SLL 23706.119365
SOS 648.328301
SRD 41.65574
STD 23399.183974
SVC 9.927165
SYP 14698.16681
SZL 21.106366
THB 37.877026
TJS 11.95779
TMT 3.95677
TND 3.369509
TOP 2.647759
TRY 43.521871
TTD 7.684517
TWD 36.279623
TZS 3041.060374
UAH 47.062065
UGX 4155.844844
USD 1.130506
UYU 47.739294
UZS 14673.267654
VES 98.057763
VND 29398.798801
VUV 136.123514
WST 3.129691
XAF 654.975339
XAG 0.035176
XAU 0.000349
XCD 3.055248
XDR 0.814579
XOF 654.989802
XPF 119.331742
YER 276.917357
ZAR 21.080821
ZMK 10175.90214
ZMW 31.567966
ZWL 364.02235
IA generativa recorre a livros para crescer
IA generativa recorre a livros para crescer / foto: Kirill Kudryavtsev - AFP

IA generativa recorre a livros para crescer

Para expandir o negócio dos direitos autorais, o mundo editorial começa a assinar contratos com empresas de tecnologia para permitir que os seus livros alimentem as necessidades crescentes da inteligência artificial generativa.

Tamanho do texto:

A grande editora americana HarperCollins acaba de propor a alguns dos seus autores um contrato com uma sociedade de inteligência artificial para que esta possa usar os seus livros para treinar o seu modelo de IA generativa.

Em um e-mail consultado pela AFP, a empresa tecnológica, cuja identidade é confidencial, propõe 2.500 dólares (14.530 reais) por cada livro selecionado para treinar o seu modelo de linguagem durante um período de três anos.

Para produzir todos os tipos de conteúdo, esta tecnologia precisa ser alimentada continuamente com uma grande quantidade de dados.

Contactada pela AFP, a editora confirmou a operação.

"A HarperCollins fechou um acordo com uma empresa de tecnologia de inteligência artificial para autorizar o uso limitado de determinados títulos (…) para treinar modelos de IA, a fim de melhorar sua qualidade e desempenho", escreveu.

A editora especificou que o acordo "limita claramente a produção de modelos que respeitem os direitos autorais".

A oferta gerou opiniões divergentes no setor e escritores como o americano Daniel Kibblesmith rejeitaram-na categoricamente.

"Provavelmente faria isso por um bilhão de dólares. Faria isso por uma quantia de dinheiro que não me obrigaria a trabalhar mais, porque esse é o objetivo final desta tecnologia", publicou na rede social Bluesky.

- Novos materiais -

A HarperCollins é um dos maiores atores do setor a dar esse passo, mas não o primeiro.

A editora americana de livros científicos Wiley deu acesso "ao conteúdo de livros acadêmicos e profissionais publicados para uso específico na formação desses modelos por 23 milhões de dólares (133 milhões de reais) a uma grande empresa de tecnologia", disse a companhia em março durante a apresentação de seus resultados financeiros.

Este tipo de colaboração evidencia os problemas ligados ao desenvolvimento da inteligência artificial generativa, treinada com enormes quantidades de dados recolhidos na Internet, o que pode resultar em possíveis violações de direitos autorais.

Para Giada Pistilli, chefe de ética da Hugging Face, plataforma franco-americana de IA de acesso livre, o anúncio é um avanço, porque o conteúdo dos livros passa a ser monetizado. Mas lamenta a margem de negociação limitada para os autores.

"O que veremos é um mecanismo de acordos bilaterais entre empresas de novas tecnologias e editoras ou proprietários de direitos autorais, quando na minha opinião seria necessário um diálogo mais amplo para incluir todas as partes envolvidas", afirma.

"Viemos de muito longe", comenta Julien Chouraqui, diretor jurídico do sindicato editorial francês SNE. "É um progresso: o fato de haver um acordo significa que houve um diálogo e uma vontade de alcançar um equilíbrio no uso de dados de origem que estão protegidos por direitos autorais e que vão gerar valor", afirma.

Os editores de imprensa também estão se organizando para enfrentar esse problema. No final de 2023, o jornal americano The New York Times processou a OpenAI, criadora do programa ChatGPT, e a Microsoft, sua principal investidora, por violação de direitos autorais.

Outros veículos de comunicação optaram por fechar acordos com esta empresa pioneira em IA.

As empresas de tecnologia podem não ter outra opção senão investir a fundo para melhorar os seus produtos, já que suas bases de dados e materiais para treinar os seus modelos estão esgotando.

A imprensa americana publicou recentemente que os novos modelos em desenvolvimento dão sinais de ter atingido o seu limite, especialmente no Google, Anthropic e OpenAI.

"Na Internet, você coleta material lícito e ilícito e muito conteúdo pirateado. Isso implica um problema jurídico. Sem esquecer o problema da qualidade dos dados", afirma Julien Chouraqui, do SNE.

"Para que o desenvolvimento de um mercado seja alcançado sobre uma base virtuosa, todos os atores devem estar envolvidos", destaca.

B.Hornik--TPP