Zürcher Nachrichten - OpenAI donne la vision et la voix à ChatGPT

EUR -
AED 3.826681
AFN 70.961758
ALL 98.138602
AMD 405.652886
ANG 1.877182
AOA 951.190259
ARS 1045.720247
AUD 1.602814
AWG 1.877897
AZN 1.775245
BAM 1.955573
BBD 2.102956
BDT 124.465544
BGN 1.955294
BHD 0.392554
BIF 3076.642669
BMD 1.041829
BND 1.403837
BOB 7.197164
BRL 6.043693
BSD 1.041579
BTN 87.914489
BWP 14.229347
BYN 3.408604
BYR 20419.848375
BZD 2.099456
CAD 1.456529
CDF 2991.091432
CHF 0.930957
CLF 0.036923
CLP 1018.83097
CNY 7.54601
CNH 7.562783
COP 4573.368835
CRC 530.538382
CUC 1.041829
CUP 27.608468
CVE 110.252195
CZK 25.343745
DJF 185.478458
DKK 7.457729
DOP 62.772709
DZD 139.835759
EGP 51.726992
ERN 15.627435
ETB 127.508391
FJD 2.371151
FKP 0.822333
GBP 0.831435
GEL 2.855018
GGP 0.822333
GHS 16.456089
GIP 0.822333
GMD 73.970229
GNF 8977.957272
GTQ 8.040066
GYD 217.904692
HKD 8.110066
HNL 26.320943
HRK 7.431636
HTG 136.72412
HUF 411.522823
IDR 16610.452733
ILS 3.856892
IMP 0.822333
INR 87.968134
IQD 1364.44153
IRR 43834.955489
ISK 145.523076
JEP 0.822333
JMD 165.930728
JOD 0.738765
JPY 161.244275
KES 134.884334
KGS 90.122166
KHR 4193.512952
KMF 492.268155
KPW 937.645704
KRW 1463.259646
KWD 0.320727
KYD 0.867999
KZT 520.059599
LAK 22878.342838
LBP 93271.167197
LKR 303.144792
LRD 187.998165
LSL 18.795317
LTL 3.076251
LVL 0.630192
LYD 5.086409
MAD 10.478083
MDL 18.997794
MGA 4861.435378
MKD 61.522855
MMK 3383.819949
MNT 3540.134882
MOP 8.35093
MRU 41.443187
MUR 48.810083
MVR 16.10707
MWK 1806.090235
MXN 21.283008
MYR 4.654932
MZN 66.583684
NAD 18.795317
NGN 1767.675143
NIO 38.325549
NOK 11.53576
NPR 140.663663
NZD 1.785942
OMR 0.400943
PAB 1.041579
PEN 3.949541
PGK 4.193513
PHP 61.404399
PKR 289.239507
PLN 4.337676
PYG 8131.055634
QAR 3.798559
RON 4.978071
RSD 116.991412
RUB 108.671879
RWF 1421.834864
SAR 3.911473
SBD 8.734231
SCR 14.272055
SDG 626.663972
SEK 11.497837
SGD 1.402931
SHP 0.822333
SLE 23.68116
SLL 21846.638123
SOS 595.230868
SRD 36.978718
STD 21563.75683
SVC 9.113941
SYP 2617.626467
SZL 18.788818
THB 35.922648
TJS 11.092512
TMT 3.646401
TND 3.309016
TOP 2.440072
TRY 35.9978
TTD 7.074178
TWD 33.946439
TZS 2770.578216
UAH 43.089995
UGX 3848.553017
USD 1.041829
UYU 44.294855
UZS 13362.448044
VES 48.506662
VND 26482.251319
VUV 123.688032
WST 2.90836
XAF 655.880824
XAG 0.033274
XAU 0.000384
XCD 2.815595
XDR 0.792308
XOF 655.880824
XPF 119.331742
YER 260.379151
ZAR 18.915093
ZMK 9377.71492
ZMW 28.772658
ZWL 335.468513
  • AEX

    13.6800

    879.8

    +1.58%

  • BEL20

    69.4500

    4228.29

    +1.67%

  • PX1

    41.8400

    7255.01

    +0.58%

  • ISEQ

    17.2700

    9613.97

    +0.18%

  • OSEBX

    3.8100

    1468.66

    +0.26%

  • PSI20

    48.3400

    6409

    +0.76%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    86.5000

    2989.04

    +2.98%

  • N150

    24.5300

    3295.3

    +0.75%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

S.Scheidegger--NZN