The Prague Post - IA generativa recorre a livros para crescer

EUR -
AED 4.228311
AFN 80.594413
ALL 97.576286
AMD 440.446931
ANG 2.060886
AOA 1055.783314
ARS 1704.187913
AUD 1.767316
AWG 2.07242
AZN 1.957879
BAM 1.955154
BBD 2.318544
BDT 140.503577
BGN 1.956204
BHD 0.434062
BIF 3384.953096
BMD 1.151345
BND 1.500804
BOB 7.983397
BRL 6.1681
BSD 1.15112
BTN 102.127039
BWP 15.45596
BYN 3.924403
BYR 22566.353973
BZD 2.315235
CAD 1.620178
CDF 2602.03876
CHF 0.930977
CLF 0.027559
CLP 1081.146872
CNY 8.198722
CNH 8.207728
COP 4440.102846
CRC 577.609155
CUC 1.151345
CUP 30.510632
CVE 110.649356
CZK 24.336091
DJF 204.61695
DKK 7.465676
DOP 73.973374
DZD 150.62245
EGP 54.397007
ERN 17.270169
ETB 175.723983
FJD 2.623907
FKP 0.875434
GBP 0.877399
GEL 3.13187
GGP 0.875434
GHS 12.578419
GIP 0.875434
GMD 84.625807
GNF 10005.184652
GTQ 8.822123
GYD 240.840425
HKD 8.950006
HNL 30.338089
HRK 7.535086
HTG 150.720201
HUF 387.463721
IDR 19258.022859
ILS 3.767389
IMP 0.875434
INR 102.037103
IQD 1508.261413
IRR 48485.994878
ISK 145.406902
JEP 0.875434
JMD 184.778948
JOD 0.816307
JPY 177.034211
KES 148.810985
KGS 100.683909
KHR 4622.64858
KMF 490.472532
KPW 1036.210008
KRW 1657.832376
KWD 0.35375
KYD 0.959283
KZT 604.747057
LAK 24915.09672
LBP 103078.300883
LKR 350.464205
LRD 211.214431
LSL 20.321531
LTL 3.399621
LVL 0.696437
LYD 6.280547
MAD 10.719359
MDL 19.592612
MGA 5163.780702
MKD 61.484392
MMK 2417.607412
MNT 4128.935294
MOP 9.216755
MRU 46.100013
MUR 53.054194
MVR 17.736497
MWK 1999.885378
MXN 21.317835
MYR 4.840829
MZN 73.628516
NAD 20.321457
NGN 1661.389929
NIO 42.311684
NOK 11.681024
NPR 163.40701
NZD 2.026801
OMR 0.442685
PAB 1.15132
PEN 3.888117
PGK 4.849411
PHP 67.534996
PKR 324.96725
PLN 4.256861
PYG 8169.300825
QAR 4.191933
RON 5.086064
RSD 117.222942
RUB 93.256087
RWF 1668.873984
SAR 4.318049
SBD 9.476248
SCR 16.57193
SDG 691.380183
SEK 10.938584
SGD 1.50258
SHP 0.863807
SLE 25.962795
SLL 24143.119848
SOS 657.990849
SRD 44.672746
STD 23830.508467
STN 24.753909
SVC 10.072672
SYP 12730.13694
SZL 20.320911
THB 37.476246
TJS 10.625059
TMT 4.04122
TND 3.331703
TOP 2.696569
TRY 48.436814
TTD 7.796424
TWD 35.586336
TZS 2833.524595
UAH 48.410305
UGX 4005.693896
USD 1.151345
UYU 45.884839
UZS 13804.621426
VES 257.535288
VND 30321.811134
VUV 140.036406
WST 3.223277
XAF 655.743187
XAG 0.024197
XAU 0.00029
XCD 3.111566
XCG 2.074715
XDR 0.816016
XOF 655.699936
XPF 119.331742
YER 274.653113
ZAR 20.003312
ZMK 10363.487699
ZMW 25.642639
ZWL 370.732488
IA generativa recorre a livros para crescer
IA generativa recorre a livros para crescer / foto: Kirill Kudryavtsev - AFP

IA generativa recorre a livros para crescer

Para expandir o negócio dos direitos autorais, o mundo editorial começa a assinar contratos com empresas de tecnologia para permitir que os seus livros alimentem as necessidades crescentes da inteligência artificial generativa.

Tamanho do texto:

A grande editora americana HarperCollins acaba de propor a alguns dos seus autores um contrato com uma sociedade de inteligência artificial para que esta possa usar os seus livros para treinar o seu modelo de IA generativa.

Em um e-mail consultado pela AFP, a empresa tecnológica, cuja identidade é confidencial, propõe 2.500 dólares (14.530 reais) por cada livro selecionado para treinar o seu modelo de linguagem durante um período de três anos.

Para produzir todos os tipos de conteúdo, esta tecnologia precisa ser alimentada continuamente com uma grande quantidade de dados.

Contactada pela AFP, a editora confirmou a operação.

"A HarperCollins fechou um acordo com uma empresa de tecnologia de inteligência artificial para autorizar o uso limitado de determinados títulos (…) para treinar modelos de IA, a fim de melhorar sua qualidade e desempenho", escreveu.

A editora especificou que o acordo "limita claramente a produção de modelos que respeitem os direitos autorais".

A oferta gerou opiniões divergentes no setor e escritores como o americano Daniel Kibblesmith rejeitaram-na categoricamente.

"Provavelmente faria isso por um bilhão de dólares. Faria isso por uma quantia de dinheiro que não me obrigaria a trabalhar mais, porque esse é o objetivo final desta tecnologia", publicou na rede social Bluesky.

- Novos materiais -

A HarperCollins é um dos maiores atores do setor a dar esse passo, mas não o primeiro.

A editora americana de livros científicos Wiley deu acesso "ao conteúdo de livros acadêmicos e profissionais publicados para uso específico na formação desses modelos por 23 milhões de dólares (133 milhões de reais) a uma grande empresa de tecnologia", disse a companhia em março durante a apresentação de seus resultados financeiros.

Este tipo de colaboração evidencia os problemas ligados ao desenvolvimento da inteligência artificial generativa, treinada com enormes quantidades de dados recolhidos na Internet, o que pode resultar em possíveis violações de direitos autorais.

Para Giada Pistilli, chefe de ética da Hugging Face, plataforma franco-americana de IA de acesso livre, o anúncio é um avanço, porque o conteúdo dos livros passa a ser monetizado. Mas lamenta a margem de negociação limitada para os autores.

"O que veremos é um mecanismo de acordos bilaterais entre empresas de novas tecnologias e editoras ou proprietários de direitos autorais, quando na minha opinião seria necessário um diálogo mais amplo para incluir todas as partes envolvidas", afirma.

"Viemos de muito longe", comenta Julien Chouraqui, diretor jurídico do sindicato editorial francês SNE. "É um progresso: o fato de haver um acordo significa que houve um diálogo e uma vontade de alcançar um equilíbrio no uso de dados de origem que estão protegidos por direitos autorais e que vão gerar valor", afirma.

Os editores de imprensa também estão se organizando para enfrentar esse problema. No final de 2023, o jornal americano The New York Times processou a OpenAI, criadora do programa ChatGPT, e a Microsoft, sua principal investidora, por violação de direitos autorais.

Outros veículos de comunicação optaram por fechar acordos com esta empresa pioneira em IA.

As empresas de tecnologia podem não ter outra opção senão investir a fundo para melhorar os seus produtos, já que suas bases de dados e materiais para treinar os seus modelos estão esgotando.

A imprensa americana publicou recentemente que os novos modelos em desenvolvimento dão sinais de ter atingido o seu limite, especialmente no Google, Anthropic e OpenAI.

"Na Internet, você coleta material lícito e ilícito e muito conteúdo pirateado. Isso implica um problema jurídico. Sem esquecer o problema da qualidade dos dados", afirma Julien Chouraqui, do SNE.

"Para que o desenvolvimento de um mercado seja alcançado sobre uma base virtuosa, todos os atores devem estar envolvidos", destaca.

B.Hornik--TPP