The Prague Post - La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos

EUR -
AED 4.304283
AFN 79.910818
ALL 96.865313
AMD 448.10823
ANG 2.09768
AOA 1074.751829
ARS 1679.19187
AUD 1.764296
AWG 2.112585
AZN 1.985513
BAM 1.954117
BBD 2.361236
BDT 142.677087
BGN 1.954795
BHD 0.441913
BIF 3498.741139
BMD 1.17203
BND 1.503985
BOB 8.100918
BRL 6.331078
BSD 1.172375
BTN 103.418878
BWP 15.617346
BYN 3.970996
BYR 22971.794341
BZD 2.357959
CAD 1.622781
CDF 3361.965994
CHF 0.934513
CLF 0.028458
CLP 1116.369965
CNY 8.343274
CNH 8.35064
COP 4566.546589
CRC 590.59122
CUC 1.17203
CUP 31.058804
CVE 110.170561
CZK 24.314928
DJF 208.76837
DKK 7.464122
DOP 74.326287
DZD 152.107252
EGP 56.437917
ERN 17.580455
ETB 168.340542
FJD 2.625641
FKP 0.863946
GBP 0.865363
GEL 3.152868
GGP 0.863946
GHS 14.302496
GIP 0.863946
GMD 83.80671
GNF 10167.286879
GTQ 8.988142
GYD 245.276607
HKD 9.121619
HNL 30.715539
HRK 7.535688
HTG 153.407189
HUF 391.035806
IDR 19266.127465
ILS 3.903933
IMP 0.863946
INR 103.444861
IQD 1535.883425
IRR 49313.17636
ISK 143.59707
JEP 0.863946
JMD 188.067984
JOD 0.83101
JPY 173.31105
KES 151.450271
KGS 102.494079
KHR 4698.891878
KMF 491.665928
KPW 1054.769967
KRW 1631.196579
KWD 0.35795
KYD 0.977046
KZT 633.935766
LAK 25422.07556
LBP 104986.213208
LKR 353.736773
LRD 227.485249
LSL 20.347358
LTL 3.460701
LVL 0.708949
LYD 6.330546
MAD 10.557805
MDL 19.472975
MGA 5195.723496
MKD 61.48703
MMK 2460.173079
MNT 4215.607632
MOP 9.398024
MRU 46.801482
MUR 53.30378
MVR 18.055083
MWK 2032.831419
MXN 21.660703
MYR 4.928379
MZN 74.908003
NAD 20.347271
NGN 1760.717592
NIO 43.143017
NOK 11.582765
NPR 165.461341
NZD 1.970077
OMR 0.45064
PAB 1.172435
PEN 4.085798
PGK 4.968741
PHP 66.961615
PKR 332.860568
PLN 4.256644
PYG 8377.782738
QAR 4.279831
RON 5.069617
RSD 117.143251
RUB 97.891375
RWF 1698.814769
SAR 4.396931
SBD 9.638512
SCR 17.653766
SDG 704.972116
SEK 10.947384
SGD 1.504401
SHP 0.921032
SLE 27.407905
SLL 24576.88749
SOS 670.014224
SRD 46.614576
STD 24258.661377
STN 24.478912
SVC 10.257201
SYP 15238.600574
SZL 20.327228
THB 37.194972
TJS 11.032102
TMT 4.102106
TND 3.412845
TOP 2.745009
TRY 48.487422
TTD 7.971031
TWD 35.520485
TZS 2883.194214
UAH 48.333268
UGX 4120.503019
USD 1.17203
UYU 46.959746
UZS 14593.365903
VES 184.631777
VND 30924.020086
VUV 139.967203
WST 3.113989
XAF 655.384014
XAG 0.027799
XAU 0.000321
XCD 3.167471
XCG 2.112953
XDR 0.814879
XOF 655.395188
XPF 119.331742
YER 280.819622
ZAR 20.374221
ZMK 10549.641285
ZMW 27.814682
ZWL 377.393286
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos / Foto: Kirill KUDRYAVTSEV - AFP

La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos

Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.

Tamaño del texto:

Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.

Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.

"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".

A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.

Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.

- Juego de dominación mundial -

La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.

Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.

Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".

Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.

En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.

En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".

"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.

- ¿Eres un robot? -

Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.

En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".

Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.

A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.

En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.

Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.

A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".

V.Sedlak--TPP