The Prague Post - IA generativa recorre a livros para crescer

EUR -
AED 4.211393
AFN 72.244796
ALL 95.982096
AMD 432.319357
ANG 2.052753
AOA 1051.557417
ARS 1603.424201
AUD 1.641243
AWG 2.064125
AZN 1.954004
BAM 1.955435
BBD 2.309469
BDT 140.703754
BGN 1.960126
BHD 0.435819
BIF 3404.065016
BMD 1.146736
BND 1.467326
BOB 7.923522
BRL 6.112796
BSD 1.146686
BTN 105.842257
BWP 15.625085
BYN 3.392867
BYR 22476.027392
BZD 2.30607
CAD 1.583471
CDF 2588.183773
CHF 0.912745
CLF 0.026638
CLP 1051.798264
CNY 7.908585
CNH 7.921286
COP 4222.512346
CRC 539.499363
CUC 1.146736
CUP 30.388506
CVE 110.244435
CZK 24.575006
DJF 204.191911
DKK 7.505507
DOP 70.446859
DZD 153.116438
EGP 59.873831
ERN 17.201041
ETB 178.984913
FJD 2.555735
FKP 0.86209
GBP 0.866311
GEL 3.131037
GGP 0.86209
GHS 12.452677
GIP 0.86209
GMD 84.289519
GNF 10052.124908
GTQ 8.79336
GYD 239.895251
HKD 8.97946
HNL 30.352338
HRK 7.568004
HTG 150.351954
HUF 394.179508
IDR 19448.701448
ILS 3.605729
IMP 0.86209
INR 106.170389
IQD 1502.119799
IRR 1515669.760861
ISK 144.837141
JEP 0.86209
JMD 179.916439
JOD 0.813081
JPY 183.185402
KES 148.312334
KGS 100.281732
KHR 4598.142277
KMF 494.243657
KPW 1032.062419
KRW 1723.258101
KWD 0.352542
KYD 0.955522
KZT 561.355287
LAK 24570.416711
LBP 102681.246162
LKR 356.863432
LRD 209.830859
LSL 19.258608
LTL 3.386014
LVL 0.69365
LYD 7.316635
MAD 10.799685
MDL 20.003269
MGA 4761.111877
MKD 61.628504
MMK 2407.469685
MNT 4092.674972
MOP 9.243576
MRU 45.877442
MUR 53.33513
MVR 17.717506
MWK 1988.229122
MXN 20.584147
MYR 4.516425
MZN 73.288336
NAD 19.258608
NGN 1588.807126
NIO 42.19213
NOK 11.176343
NPR 169.34741
NZD 1.985003
OMR 0.440925
PAB 1.146586
PEN 3.954262
PGK 5.014065
PHP 68.334433
PKR 320.169477
PLN 4.298483
PYG 7397.620071
QAR 4.168222
RON 5.117429
RSD 117.34811
RUB 91.632507
RWF 1673.28787
SAR 4.303626
SBD 9.233195
SCR 17.507734
SDG 689.18878
SEK 10.871865
SGD 1.469547
SHP 0.860349
SLE 28.152796
SLL 24046.494883
SOS 654.177972
SRD 43.05769
STD 23735.121842
STN 24.495431
SVC 10.033128
SYP 126.742984
SZL 19.252409
THB 37.071728
TJS 10.99055
TMT 4.013576
TND 3.391067
TOP 2.761065
TRY 50.645643
TTD 7.776549
TWD 36.918714
TZS 2986.942825
UAH 50.565468
UGX 4311.195803
USD 1.146736
UYU 46.061408
UZS 13845.417319
VES 507.665371
VND 30152.278788
VUV 135.605293
WST 3.13657
XAF 655.834663
XAG 0.014239
XAU 0.000228
XCD 3.099112
XCG 2.066515
XDR 0.815648
XOF 655.834663
XPF 119.331742
YER 273.554311
ZAR 19.360243
ZMK 10322.005017
ZMW 22.318837
ZWL 369.248554
IA generativa recorre a livros para crescer
IA generativa recorre a livros para crescer / foto: Kirill Kudryavtsev - AFP

IA generativa recorre a livros para crescer

Para expandir o negócio dos direitos autorais, o mundo editorial começa a assinar contratos com empresas de tecnologia para permitir que os seus livros alimentem as necessidades crescentes da inteligência artificial generativa.

Tamanho do texto:

A grande editora americana HarperCollins acaba de propor a alguns dos seus autores um contrato com uma sociedade de inteligência artificial para que esta possa usar os seus livros para treinar o seu modelo de IA generativa.

Em um e-mail consultado pela AFP, a empresa tecnológica, cuja identidade é confidencial, propõe 2.500 dólares (14.530 reais) por cada livro selecionado para treinar o seu modelo de linguagem durante um período de três anos.

Para produzir todos os tipos de conteúdo, esta tecnologia precisa ser alimentada continuamente com uma grande quantidade de dados.

Contactada pela AFP, a editora confirmou a operação.

"A HarperCollins fechou um acordo com uma empresa de tecnologia de inteligência artificial para autorizar o uso limitado de determinados títulos (…) para treinar modelos de IA, a fim de melhorar sua qualidade e desempenho", escreveu.

A editora especificou que o acordo "limita claramente a produção de modelos que respeitem os direitos autorais".

A oferta gerou opiniões divergentes no setor e escritores como o americano Daniel Kibblesmith rejeitaram-na categoricamente.

"Provavelmente faria isso por um bilhão de dólares. Faria isso por uma quantia de dinheiro que não me obrigaria a trabalhar mais, porque esse é o objetivo final desta tecnologia", publicou na rede social Bluesky.

- Novos materiais -

A HarperCollins é um dos maiores atores do setor a dar esse passo, mas não o primeiro.

A editora americana de livros científicos Wiley deu acesso "ao conteúdo de livros acadêmicos e profissionais publicados para uso específico na formação desses modelos por 23 milhões de dólares (133 milhões de reais) a uma grande empresa de tecnologia", disse a companhia em março durante a apresentação de seus resultados financeiros.

Este tipo de colaboração evidencia os problemas ligados ao desenvolvimento da inteligência artificial generativa, treinada com enormes quantidades de dados recolhidos na Internet, o que pode resultar em possíveis violações de direitos autorais.

Para Giada Pistilli, chefe de ética da Hugging Face, plataforma franco-americana de IA de acesso livre, o anúncio é um avanço, porque o conteúdo dos livros passa a ser monetizado. Mas lamenta a margem de negociação limitada para os autores.

"O que veremos é um mecanismo de acordos bilaterais entre empresas de novas tecnologias e editoras ou proprietários de direitos autorais, quando na minha opinião seria necessário um diálogo mais amplo para incluir todas as partes envolvidas", afirma.

"Viemos de muito longe", comenta Julien Chouraqui, diretor jurídico do sindicato editorial francês SNE. "É um progresso: o fato de haver um acordo significa que houve um diálogo e uma vontade de alcançar um equilíbrio no uso de dados de origem que estão protegidos por direitos autorais e que vão gerar valor", afirma.

Os editores de imprensa também estão se organizando para enfrentar esse problema. No final de 2023, o jornal americano The New York Times processou a OpenAI, criadora do programa ChatGPT, e a Microsoft, sua principal investidora, por violação de direitos autorais.

Outros veículos de comunicação optaram por fechar acordos com esta empresa pioneira em IA.

As empresas de tecnologia podem não ter outra opção senão investir a fundo para melhorar os seus produtos, já que suas bases de dados e materiais para treinar os seus modelos estão esgotando.

A imprensa americana publicou recentemente que os novos modelos em desenvolvimento dão sinais de ter atingido o seu limite, especialmente no Google, Anthropic e OpenAI.

"Na Internet, você coleta material lícito e ilícito e muito conteúdo pirateado. Isso implica um problema jurídico. Sem esquecer o problema da qualidade dos dados", afirma Julien Chouraqui, do SNE.

"Para que o desenvolvimento de um mercado seja alcançado sobre uma base virtuosa, todos os atores devem estar envolvidos", destaca.

B.Hornik--TPP