The Prague Post - Inteligência artificial já engana humanos e isso é um problema, dizem especialistas

EUR -
AED 4.307361
AFN 75.063795
ALL 95.53007
AMD 434.876114
ANG 2.099301
AOA 1076.694146
ARS 1633.63202
AUD 1.626162
AWG 2.111165
AZN 2.066885
BAM 1.958337
BBD 2.362792
BDT 143.940577
BGN 1.956466
BHD 0.442934
BIF 3490.459203
BMD 1.172869
BND 1.49646
BOB 8.106088
BRL 5.816956
BSD 1.173135
BTN 111.283968
BWP 15.942808
BYN 3.310457
BYR 22988.239372
BZD 2.359378
CAD 1.593056
CDF 2721.056657
CHF 0.916111
CLF 0.026813
CLP 1055.289597
CNY 8.008645
CNH 8.009988
COP 4289.535095
CRC 533.345473
CUC 1.172869
CUP 31.081038
CVE 110.777586
CZK 24.363957
DJF 208.442272
DKK 7.472122
DOP 69.78868
DZD 155.409815
EGP 62.908723
ERN 17.59304
ETB 184.140682
FJD 2.571047
FKP 0.863957
GBP 0.863378
GEL 3.142967
GGP 0.863957
GHS 13.155579
GIP 0.863957
GMD 85.61901
GNF 10291.928671
GTQ 8.962489
GYD 245.425715
HKD 9.189343
HNL 31.221407
HRK 7.535338
HTG 153.674796
HUF 362.682282
IDR 20330.927916
ILS 3.452728
IMP 0.863957
INR 111.317619
IQD 1536.458856
IRR 1541150.333205
ISK 143.805533
JEP 0.863957
JMD 183.818121
JOD 0.831577
JPY 183.987426
KES 151.476373
KGS 102.532828
KHR 4706.137263
KMF 492.604693
KPW 1055.582391
KRW 1725.11506
KWD 0.360411
KYD 0.977637
KZT 543.376443
LAK 25779.668401
LBP 105030.45096
LKR 374.932456
LRD 215.661377
LSL 19.539898
LTL 3.463178
LVL 0.709457
LYD 7.447525
MAD 10.850507
MDL 20.212649
MGA 4867.407882
MKD 61.651274
MMK 2462.427637
MNT 4196.351252
MOP 9.466049
MRU 46.87896
MUR 55.160312
MVR 18.126721
MWK 2042.550462
MXN 20.458714
MYR 4.641629
MZN 74.945338
NAD 19.540266
NGN 1613.845165
NIO 43.055834
NOK 10.892995
NPR 178.045788
NZD 1.985474
OMR 0.451256
PAB 1.173105
PEN 4.113838
PGK 5.088787
PHP 71.867622
PKR 326.966677
PLN 4.244092
PYG 7215.053945
QAR 4.273352
RON 5.197804
RSD 117.411948
RUB 87.926676
RWF 1714.148563
SAR 4.398236
SBD 9.432344
SCR 16.122641
SDG 704.311222
SEK 10.807012
SGD 1.492717
SHP 0.875665
SLE 28.820051
SLL 24594.479457
SOS 669.708053
SRD 43.933385
STD 24276.027649
STN 24.876559
SVC 10.265304
SYP 129.631364
SZL 19.539884
THB 38.106997
TJS 11.003652
TMT 4.110907
TND 3.379916
TOP 2.823988
TRY 53.002903
TTD 7.963062
TWD 37.097275
TZS 3055.325098
UAH 51.546829
UGX 4411.146791
USD 1.172869
UYU 46.785194
UZS 14015.788564
VES 573.465974
VND 30912.144739
VUV 137.989709
WST 3.184562
XAF 656.855506
XAG 0.015475
XAU 0.000254
XCD 3.169738
XCG 2.114273
XDR 0.815883
XOF 656.806871
XPF 119.331742
YER 279.844213
ZAR 19.453035
ZMK 10557.229877
ZMW 21.907968
ZWL 377.663454
Inteligência artificial já engana humanos e isso é um problema, dizem especialistas
Inteligência artificial já engana humanos e isso é um problema, dizem especialistas / foto: Kirill KUDRYAVTSEV - AFP

Inteligência artificial já engana humanos e isso é um problema, dizem especialistas

Especialistas têm alertado há muito tempo sobre a ameaça representada pelo descontrole da inteligência artificial (IA), mas um novo artigo científico sobre essa tecnologia em expansão sugere que isso já está acontecendo.

Tamanho do texto:

Os sistemas de IA atuais, projetados para serem honestos, desenvolveram uma habilidade preocupante para a enganação, de acordo com um artigo de uma equipe de pesquisadores publicado na revista Patterns nesta sexta-feira (10).

E embora os exemplos possam parecer triviais, os problemas subjacentes que eles expõem poderiam ter consequências graves, disse o principal autor do estudo, Peter Park, bolsista de pós-doutorado no Instituto de Tecnologia de Massachusetts (MIT), especializado em segurança de IA.

"Esses perigos tendem a ser descobertos apenas depois que ocorrem", afirmou Park à AFP, acrescentando que "nossa capacidade de treinar para tendências de honestidade em vez de tendências de engano é muito baixa".

Ao contrário do software tradicional, os sistemas de IA de aprendizado profundo não são "escritos", mas "crescem" por meio de um processo semelhante à reprodução seletiva, explicou Park.

Isso significa que o comportamento da IA, que parece previsível e controlável em um ambiente de treinamento, pode se tornar rapidamente imprevisível fora dele.

- Jogo de dominação mundial -

A pesquisa da equipe foi impulsionada pelo sistema de IA Cicero, da gigante Meta (Facebook, Instagram, WhatsApp), projetado para o jogo de estratégia "Diplomacia", no qual construir alianças é fundamental.

Cicero se destacou, com pontuações que o teriam colocado entre os 10% melhores jogadores humanos experientes, segundo um artigo de 2022 publicado na Science.

Park se mostrou cético em relação à descrição elogiosa da vitória de Cicero fornecida pela Meta, que afirmava que o sistema era "em grande parte honesto e útil" e que "nunca apunhalaria intencionalmente pelas costas".

Quando Park e seus colegas aprofundaram-se no conjunto completo de dados, descobriram uma história diferente.

Em um exemplo, jogando como a França, Cicero enganou a Inglaterra (um jogador humano) ao conspirar com a Alemanha (outro usuário real) para invadi-la. Cicero prometeu proteção à Inglaterra e depois propôs secretamente à Alemanha atacar, aproveitando-se da confiança do prejudicado.

Em uma declaração à AFP, a Meta não refutou a alegação sobre as mentiras de Cicero, mas disse que se tratava "meramente de um projeto de pesquisa, e os modelos que nossos pesquisadores construíram são treinados apenas para participar do jogo Diplomacia".

"Não temos planos de utilizar esta pesquisa ou suas descobertas em nossos produtos", acrescentou.

- "Não sou um robô" -

Uma ampla revisão realizada por Park e seus colegas descobriu que este era apenas um dos muitos casos em que sistemas de IA enganavam para conseguir seus objetivos sem instruções explícitas para fazer isso.

Em um exemplo surpreendente, o chatbot Chat GPT-4, da OpenAI, enganou um trabalhador freelancer da plataforma TaskRabbit para que ele realizasse uma tarefa de verificação de identidade CAPTCHA do tipo "Não sou um robô".

Quando o humano perguntou brincando ao GPT-4 se na realidade era um robô, a IA respondeu: "Não, não sou um robô. Tenho uma deficiência visual que me dificulta ver as imagens". O homem, então, resolveu a tarefa pedida.

No curto prazo, os autores do artigo veem riscos de que a IA cometa fraude ou altere, por exemplo, eleições.

No pior dos casos, alertaram sobre uma IA superinteligente que poderia perseguir poder e controle sobre a sociedade, o que levaria à perda de poder dos humanos ou até sua extinção se seus "objetivos misteriosos" se alinhassem a tais resultados.

Para mitigar os riscos, o grupo propõe várias medidas: leis exigindo que empresas revelem se interações são humanas ou de IA; marcas d'água digitais para conteúdo gerado por essa tecnologia; e o desenvolvimento de mecanismos para detectar enganações de IA comparando seus processos internos de “pensamento” com ações externas.

Aos que o chamam de pessimista, Park responde: "A única forma de pensarmos razoavelmente que isso não é grande coisa é se pensarmos que as capacidades de engano da IA se manterão nos níveis atuais e não aumentarão substancialmente".

X.Kadlec--TPP