Zürcher Nachrichten - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.104397
AFN 76.945413
ALL 99.231189
AMD 432.617988
ANG 2.010719
AOA 1036.724537
ARS 1074.259252
AUD 1.641361
AWG 2.011389
AZN 1.904081
BAM 1.955429
BBD 2.252673
BDT 133.324726
BGN 1.955529
BHD 0.42042
BIF 3234.286875
BMD 1.117438
BND 1.441627
BOB 7.709539
BRL 6.055052
BSD 1.115688
BTN 93.249023
BWP 14.748204
BYN 3.651208
BYR 21901.788071
BZD 2.248874
CAD 1.517202
CDF 3208.165381
CHF 0.950204
CLF 0.037689
CLP 1039.944272
CNY 7.880067
CNH 7.870123
COP 4641.820049
CRC 578.89026
CUC 1.117438
CUP 29.612111
CVE 110.244101
CZK 25.088056
DJF 198.672338
DKK 7.466767
DOP 66.967305
DZD 147.657009
EGP 54.142736
ERN 16.761573
ETB 129.466357
FJD 2.459262
FKP 0.850995
GBP 0.839107
GEL 3.051043
GGP 0.850995
GHS 17.539675
GIP 0.850995
GMD 76.548818
GNF 9639.172699
GTQ 8.624365
GYD 233.395755
HKD 8.704949
HNL 27.675753
HRK 7.597474
HTG 147.212093
HUF 393.517458
IDR 16941.25656
ILS 4.221139
IMP 0.850995
INR 93.284241
IQD 1461.522939
IRR 47035.770303
ISK 152.262556
JEP 0.850995
JMD 175.286771
JOD 0.791709
JPY 160.803866
KES 143.922717
KGS 94.13132
KHR 4531.14103
KMF 493.181764
KPW 1005.693717
KRW 1488.975611
KWD 0.340897
KYD 0.929724
KZT 534.908597
LAK 24636.329683
LBP 99909.860054
LKR 340.395471
LRD 223.1377
LSL 19.586187
LTL 3.299505
LVL 0.675928
LYD 5.297996
MAD 10.818149
MDL 19.468309
MGA 5046.04342
MKD 61.603322
MMK 3629.395577
MNT 3797.054841
MOP 8.955702
MRU 44.337595
MUR 51.268486
MVR 17.164273
MWK 1934.433289
MXN 21.697078
MYR 4.698871
MZN 71.348848
NAD 19.586187
NGN 1831.984424
NIO 41.062216
NOK 11.713438
NPR 149.198716
NZD 1.791484
OMR 0.429669
PAB 1.115688
PEN 4.181807
PGK 4.367172
PHP 62.188829
PKR 309.994034
PLN 4.274593
PYG 8704.349913
QAR 4.067529
RON 4.972492
RSD 117.203662
RUB 103.07316
RWF 1504.014883
SAR 4.193134
SBD 9.282489
SCR 14.578236
SDG 672.143165
SEK 11.364797
SGD 1.442952
SHP 0.850995
SLE 25.530448
SLL 23432.113894
SOS 637.579134
SRD 33.752262
STD 23128.713955
SVC 9.762149
SYP 2807.596846
SZL 19.593286
THB 36.793929
TJS 11.859752
TMT 3.911034
TND 3.380559
TOP 2.617156
TRY 38.132438
TTD 7.588561
TWD 35.736832
TZS 3045.822602
UAH 46.114158
UGX 4133.216465
USD 1.117438
UYU 46.101261
UZS 14197.308611
VEF 4047978.463464
VES 41.096875
VND 27494.566096
VUV 132.664504
WST 3.125992
XAF 655.832674
XAG 0.035881
XAU 0.000426
XCD 3.019933
XDR 0.826843
XOF 655.832674
XPF 119.331742
YER 279.722751
ZAR 19.426272
ZMK 10058.288435
ZMW 29.537401
ZWL 359.814634
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

F.Carpenteri--NZN