The Prague Post - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.226203
AFN 73.071893
ALL 93.960321
AMD 423.724896
ANG 2.060342
AOA 1055.835022
ARS 1653.354187
AUD 1.639764
AWG 2.071386
AZN 1.955326
BAM 1.939252
BBD 2.318912
BDT 141.335156
BGN 1.945814
BHD 0.43396
BIF 3441.95307
BMD 1.15077
BND 1.475013
BOB 7.984862
BRL 5.858341
BSD 1.151375
BTN 108.817416
BWP 15.427352
BYN 3.187599
BYR 22555.092
BZD 2.31564
CAD 1.622315
CDF 2669.786539
CHF 0.919891
CLF 0.025899
CLP 1019.305887
CNY 7.776271
CNH 7.7963
COP 3952.89495
CRC 524.424864
CUC 1.15077
CUP 30.495405
CVE 109.726009
CZK 23.938375
DJF 204.514691
DKK 7.406517
DOP 67.435057
DZD 152.913136
EGP 57.432856
ERN 17.26155
ETB 182.253223
FJD 2.570475
FKP 0.856318
GBP 0.86513
GEL 3.043786
GGP 0.856318
GHS 13.001054
GIP 0.856318
GMD 84.005847
GNF 10100.882542
GTQ 8.776185
GYD 240.844771
HKD 9.016467
HNL 30.722333
HRK 7.534434
HTG 150.366857
HUF 345.978589
IDR 20424.556422
ILS 3.390134
IMP 0.856318
INR 108.528541
IQD 1507.5087
IRR 1582308.749934
ISK 143.07527
JEP 0.856318
JMD 182.096098
JOD 0.815918
JPY 184.425851
KES 149.047935
KGS 100.634562
KHR 4617.456644
KMF 489.077033
KPW 1035.693403
KRW 1739.808883
KWD 0.35455
KYD 0.959512
KZT 561.483746
LAK 25351.462874
LBP 103051.453562
LKR 385.721827
LRD 209.61256
LSL 18.636557
LTL 3.397924
LVL 0.696089
LYD 7.336181
MAD 10.638889
MDL 20.09155
MGA 4833.233941
MKD 61.09051
MMK 2415.980579
MNT 4116.679238
MOP 9.289529
MRU 46.122914
MUR 54.236067
MVR 17.791185
MWK 1997.737016
MXN 19.912233
MYR 4.677655
MZN 73.536625
NAD 18.64468
NGN 1564.034121
NIO 42.129805
NOK 11.063848
NPR 174.106761
NZD 1.992227
OMR 0.442469
PAB 1.151375
PEN 3.927015
PGK 5.049291
PHP 69.475448
PKR 320.257204
PLN 4.197629
PYG 7026.04384
QAR 4.189381
RON 5.186562
RSD 116.309537
RUB 83.973466
RWF 1712.34576
SAR 4.317567
SBD 9.276845
SCR 16.24326
SDG 691.036606
SEK 10.942217
SGD 1.475321
SHP 0.859166
SLE 28.481893
SLL 24131.075732
SOS 657.673717
SRD 42.960576
STD 23818.615605
STN 24.626478
SVC 10.074121
SYP 127.197022
SZL 18.638884
THB 37.439728
TJS 10.673122
TMT 4.039203
TND 3.350755
TOP 2.770778
TRY 53.456132
TTD 7.821258
TWD 36.316578
TZS 3020.774668
UAH 51.564725
UGX 4259.650626
USD 1.15077
UYU 46.483739
UZS 13814.993686
VES 685.900804
VND 30295.17102
VUV 137.232574
WST 3.152781
XAF 650.406808
XAG 0.016857
XAU 0.000269
XCD 3.110014
XCG 2.075074
XDR 0.809794
XOF 650.185256
XPF 119.331742
YER 274.60252
ZAR 18.845855
ZMK 10358.309615
ZMW 20.350342
ZWL 370.54747
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

H.Vesely--TPP