The Prague Post - Expertos preocupados porque la inteligencia artificial ya engaña a humanos

EUR -
AED 4.251414
AFN 74.088646
ALL 95.026994
AMD 426.531394
ANG 2.072633
AOA 1062.709062
ARS 1653.556927
AUD 1.643668
AWG 2.085509
AZN 1.979337
BAM 1.955944
BBD 2.331272
BDT 142.370479
BGN 1.957423
BHD 0.436232
BIF 3438.353075
BMD 1.157635
BND 1.486109
BOB 7.998589
BRL 5.859372
BSD 1.157485
BTN 110.036099
BWP 15.582147
BYN 3.202536
BYR 22689.650041
BZD 2.327971
CAD 1.619821
CDF 2656.772889
CHF 0.922126
CLF 0.026528
CLP 1047.547103
CNY 7.838927
CNH 7.828265
COP 4043.497616
CRC 526.538755
CUC 1.157635
CUP 30.677333
CVE 110.273117
CZK 24.139001
DJF 206.125172
DKK 7.4747
DOP 67.965002
DZD 154.105343
EGP 60.02201
ERN 17.364528
ETB 182.392825
FJD 2.565199
FKP 0.863463
GBP 0.863585
GEL 3.073522
GGP 0.863463
GHS 12.847946
GIP 0.863463
GMD 84.50781
GNF 10139.746322
GTQ 8.823649
GYD 242.167824
HKD 9.070656
HNL 30.951278
HRK 7.540604
HTG 151.341139
HUF 352.573434
IDR 20581.943621
ILS 3.381244
IMP 0.863463
INR 110.103268
IQD 1516.311606
IRR 1592764.232717
ISK 144.299122
JEP 0.863463
JMD 183.473504
JOD 0.820785
JPY 185.381395
KES 149.891033
KGS 101.234862
KHR 4650.342282
KMF 493.152399
KPW 1041.872091
KRW 1757.313026
KWD 0.357107
KYD 0.964671
KZT 566.011661
LAK 25487.876001
LBP 103658.729662
LKR 388.048562
LRD 210.665506
LSL 18.853788
LTL 3.418196
LVL 0.700242
LYD 7.377543
MAD 10.720589
MDL 20.215488
MGA 4830.355532
MKD 61.649538
MMK 2429.813096
MNT 4141.891345
MOP 9.342188
MRU 45.907379
MUR 54.698502
MVR 17.897579
MWK 2007.147733
MXN 19.929268
MYR 4.697217
MZN 73.965579
NAD 18.853788
NGN 1574.962017
NIO 42.593135
NOK 11.033664
NPR 176.057959
NZD 1.985315
OMR 0.444823
PAB 1.157485
PEN 3.93649
PGK 5.068373
PHP 70.350654
PKR 322.044804
PLN 4.245604
PYG 7087.521668
QAR 4.231411
RON 5.239574
RSD 117.368639
RUB 83.884597
RWF 1699.825113
SAR 4.345525
SBD 9.313839
SCR 16.282398
SDG 695.164432
SEK 10.919853
SGD 1.486438
SHP 0.864292
SLE 28.535684
SLL 24275.035698
SOS 661.548692
SRD 43.422315
STD 23960.711512
STN 24.501803
SVC 10.127745
SYP 127.955848
SZL 18.838387
THB 38.054946
TJS 10.787894
TMT 4.0633
TND 3.39585
TOP 2.787308
TRY 53.552008
TTD 7.862579
TWD 36.606161
TZS 3038.423639
UAH 51.866118
UGX 4340.319463
USD 1.157635
UYU 46.753441
UZS 13863.020369
VES 673.694884
VND 30457.382275
VUV 136.802146
WST 3.175961
XAF 656.005284
XAG 0.017016
XAU 0.000275
XCD 3.128567
XCG 2.086054
XDR 0.81586
XOF 656.005284
XPF 119.331742
YER 276.230362
ZAR 18.868354
ZMK 10420.122858
ZMW 20.221488
ZWL 372.758064
Expertos preocupados porque la inteligencia artificial ya engaña a humanos
Expertos preocupados porque la inteligencia artificial ya engaña a humanos / Foto: Kirill KUDRYAVTSEV - AFP/Archivos

Expertos preocupados porque la inteligencia artificial ya engaña a humanos

Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.

Tamaño del texto:

Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.

Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.

"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".

A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.

Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.

- Juego de dominación mundial -

La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.

Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.

Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".

Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.

En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.

En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".

"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.

- ¿Eres un robot? -

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".

Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.

A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.

En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.

Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.

A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".

M.Jelinek--TPP