The Prague Post - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.309924
AFN 79.974243
ALL 96.943022
AMD 448.467719
ANG 2.101155
AOA 1076.160019
ARS 1701.464628
AUD 1.778669
AWG 2.112418
AZN 1.99972
BAM 1.955659
BBD 2.36313
BDT 142.789722
BGN 1.956941
BHD 0.442268
BIF 3501.547958
BMD 1.173566
BND 1.505192
BOB 8.107416
BRL 6.274356
BSD 1.173316
BTN 103.49655
BWP 15.629875
BYN 3.974114
BYR 23001.884322
BZD 2.35973
CAD 1.625799
CDF 3327.058693
CHF 0.935026
CLF 0.028454
CLP 1116.249652
CNY 8.361307
CNH 8.360974
COP 4566.871276
CRC 591.057456
CUC 1.173566
CUP 31.099486
CVE 110.257064
CZK 24.324263
DJF 208.934961
DKK 7.46464
DOP 74.384646
DZD 151.793074
EGP 56.346944
ERN 17.603483
ETB 168.466974
FJD 2.627266
FKP 0.865715
GBP 0.865685
GEL 3.15735
GGP 0.865715
GHS 14.31397
GIP 0.865715
GMD 83.914454
GNF 10176.267511
GTQ 8.995353
GYD 245.472331
HKD 9.128233
HNL 30.739787
HRK 7.534765
HTG 153.528949
HUF 390.89166
IDR 19255.745805
ILS 3.914974
IMP 0.865715
INR 103.599842
IQD 1537.08936
IRR 49377.769947
ISK 143.234125
JEP 0.865715
JMD 188.216452
JOD 0.832104
JPY 173.328633
KES 151.589089
KGS 102.628756
KHR 4702.661502
KMF 492.315191
KPW 1056.249192
KRW 1634.812435
KWD 0.358372
KYD 0.97783
KZT 634.444333
LAK 25441.168742
LBP 105070.437021
LKR 354.014518
LRD 208.265009
LSL 20.363334
LTL 3.465234
LVL 0.709879
LYD 6.335544
MAD 10.566139
MDL 19.488597
MGA 5199.62573
MKD 61.535571
MMK 2464.292355
MNT 4220.165991
MOP 9.405523
MRU 46.838629
MUR 53.374204
MVR 17.967732
MWK 2034.45356
MXN 21.64067
MYR 4.934889
MZN 75.003016
NAD 20.363334
NGN 1763.051862
NIO 43.176892
NOK 11.571478
NPR 165.594081
NZD 1.974536
OMR 0.449868
PAB 1.173316
PEN 4.089006
PGK 4.972642
PHP 67.093181
PKR 333.121922
PLN 4.257298
PYG 8384.39649
QAR 4.283192
RON 5.066327
RSD 117.131569
RUB 97.762963
RWF 1700.177621
SAR 4.402641
SBD 9.631311
SCR 16.740957
SDG 705.903978
SEK 10.93388
SGD 1.507332
SHP 0.922238
SLE 27.432139
SLL 24609.086612
SOS 670.551734
SRD 46.209187
STD 24290.436982
STN 24.498237
SVC 10.266261
SYP 15258.641939
SZL 20.343536
THB 37.214196
TJS 11.040905
TMT 4.119215
TND 3.415554
TOP 2.748612
TRY 48.49936
TTD 7.977426
TWD 35.558923
TZS 2886.392237
UAH 48.371218
UGX 4123.703175
USD 1.173566
UYU 46.996617
UZS 14604.948735
VES 186.280467
VND 30964.526421
VUV 139.571587
WST 3.224604
XAF 655.909788
XAG 0.027822
XAU 0.000322
XCD 3.17162
XCG 2.114648
XDR 0.815741
XOF 655.909788
XPF 119.331742
YER 281.128048
ZAR 20.406087
ZMK 10563.502225
ZMW 27.836996
ZWL 377.887621
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

H.Vesely--TPP