The Prague Post - OpenAI donne la vision et la voix à ChatGPT

EUR -
AED 4.246797
AFN 76.714303
ALL 96.555071
AMD 442.441155
ANG 2.069894
AOA 1060.397317
ARS 1642.344422
AUD 1.771411
AWG 2.08726
AZN 1.965179
BAM 1.95489
BBD 2.328017
BDT 141.124332
BGN 1.955266
BHD 0.435933
BIF 3404.515805
BMD 1.156377
BND 1.505999
BOB 8.016305
BRL 6.148572
BSD 1.155862
BTN 102.457324
BWP 15.467802
BYN 3.940366
BYR 22664.987491
BZD 2.324618
CAD 1.621251
CDF 2486.210254
CHF 0.931011
CLF 0.02776
CLP 1089.064158
CNY 8.232652
CNH 8.236422
COP 4357.575121
CRC 580.32996
CUC 1.156377
CUP 30.643988
CVE 110.214192
CZK 24.280504
DJF 205.824226
DKK 7.466992
DOP 74.305424
DZD 150.902546
EGP 54.656389
ERN 17.345654
ETB 177.49091
FJD 2.637232
FKP 0.878964
GBP 0.878256
GEL 3.127998
GGP 0.878964
GHS 12.645116
GIP 0.878964
GMD 84.415642
GNF 10033.374637
GTQ 8.859877
GYD 241.818522
HKD 8.98924
HNL 30.410849
HRK 7.534024
HTG 151.329583
HUF 383.330272
IDR 19316.929415
ILS 3.734548
IMP 0.878964
INR 102.596881
IQD 1514.195412
IRR 48683.468328
ISK 146.3981
JEP 0.878964
JMD 186.04343
JOD 0.819913
JPY 178.189609
KES 149.345886
KGS 101.125807
KHR 4641.840051
KMF 486.834265
KPW 1040.74149
KRW 1682.574936
KWD 0.355146
KYD 0.963256
KZT 605.548225
LAK 25098.321208
LBP 103506.436216
LKR 351.47645
LRD 211.521574
LSL 19.864657
LTL 3.414481
LVL 0.699481
LYD 6.307092
MAD 10.700667
MDL 19.62087
MGA 5192.583778
MKD 61.501648
MMK 2428.030891
MNT 4140.522379
MOP 9.254334
MRU 45.898841
MUR 53.031353
MVR 17.813972
MWK 2004.267371
MXN 21.27689
MYR 4.810509
MZN 73.950526
NAD 19.864657
NGN 1661.355531
NIO 42.53021
NOK 11.713381
NPR 163.931719
NZD 2.050806
OMR 0.444621
PAB 1.155862
PEN 3.901185
PGK 4.87975
PHP 68.119519
PKR 326.816225
PLN 4.234017
PYG 8188.189858
QAR 4.212858
RON 5.083545
RSD 117.182592
RUB 93.957668
RWF 1680.025512
SAR 4.337263
SBD 9.517667
SCR 16.079669
SDG 694.397947
SEK 10.998011
SGD 1.506406
SHP 0.867582
SLE 26.826195
SLL 24248.645129
SOS 659.39317
SRD 44.635006
STD 23934.667379
STN 24.488605
SVC 10.113338
SYP 12785.874001
SZL 19.858759
THB 37.401279
TJS 10.708963
TMT 4.058883
TND 3.412212
TOP 2.708355
TRY 48.837156
TTD 7.840352
TWD 35.835313
TZS 2839.722852
UAH 48.602095
UGX 4057.112138
USD 1.156377
UYU 45.988799
UZS 13887.597848
VES 263.878282
VND 30412.712807
VUV 141.677661
WST 3.262011
XAF 655.651911
XAG 0.023106
XAU 0.000283
XCD 3.125166
XCG 2.083131
XDR 0.815008
XOF 655.654745
XPF 119.331742
YER 275.793807
ZAR 19.844937
ZMK 10408.772755
ZMW 26.150831
ZWL 372.352894
  • AEX

    10.2700

    961.08

    +1.08%

  • BEL20

    58.4800

    4972.78

    +1.19%

  • PX1

    104.9500

    8055.51

    +1.32%

  • ISEQ

    282.2900

    12294.83

    +2.35%

  • OSEBX

    7.8400

    1607.11

    +0.49%

  • PSI20

    127.7200

    8314.75

    +1.56%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    87.5100

    4157.61

    +2.15%

  • N150

    53.2000

    3672.19

    +1.47%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

L.Bartos--TPP