The Prague Post - OpenAI donne la vision et la voix à ChatGPT

EUR -
AED 4.313565
AFN 79.123718
ALL 96.942304
AMD 449.964277
ANG 2.10293
AOA 1077.068973
ARS 1733.746257
AUD 1.780981
AWG 1.65172
AZN 2.001409
BAM 1.955645
BBD 2.368612
BDT 143.118638
BGN 1.955645
BHD 0.443465
BIF 3509.921346
BMD 1.174557
BND 1.51028
BOB 8.126355
BRL 6.257456
BSD 1.176007
BTN 103.550779
BWP 15.665756
BYN 3.982084
BYR 23021.312332
BZD 2.365212
CAD 1.618716
CDF 3316.948692
CHF 0.92314
CLF 0.028606
CLP 1122.220907
CNY 8.355097
CNH 8.362363
COP 4581.536271
CRC 593.252902
CUC 1.174557
CUP 31.125754
CVE 110.256247
CZK 24.289134
DJF 209.423374
DKK 7.463961
DOP 72.914211
DZD 152.200286
EGP 55.910561
ERN 17.618351
ETB 168.7896
FJD 2.644872
FKP 0.871076
GBP 0.861459
GEL 3.175838
GGP 0.871076
GHS 14.430854
GIP 0.871076
GMD 86.917617
GNF 10201.190125
GTQ 9.008285
GYD 246.040467
HKD 9.132943
HNL 30.822553
HRK 7.534199
HTG 153.877784
HUF 390.427164
IDR 19549.028935
ILS 3.918562
IMP 0.871076
INR 103.479042
IQD 1540.677685
IRR 49404.797848
ISK 143.002738
JEP 0.871076
JMD 188.585028
JOD 0.832807
JPY 173.746354
KES 151.877942
KGS 102.715439
KHR 4726.624752
KMF 490.965134
KPW 1057.100167
KRW 1641.102889
KWD 0.358722
KYD 0.980022
KZT 636.629458
LAK 25461.978567
LBP 105312.539211
LKR 355.601769
LRD 209.923334
LSL 20.40328
LTL 3.468161
LVL 0.710478
LYD 6.342496
MAD 10.608658
MDL 19.510451
MGA 5199.587203
MKD 61.530115
MMK 2465.496648
MNT 4225.694365
MOP 9.419052
MRU 47.041265
MUR 53.266593
MVR 17.97511
MWK 2039.238104
MXN 21.617134
MYR 4.941406
MZN 75.058557
NAD 20.40328
NGN 1756.644029
NIO 43.276564
NOK 11.675569
NPR 165.680847
NZD 1.985223
OMR 0.451622
PAB 1.176007
PEN 4.096675
PGK 4.91561
PHP 66.886901
PKR 333.724905
PLN 4.263727
PYG 8374.335159
QAR 4.275961
RON 5.075852
RSD 117.150699
RUB 98.182205
RWF 1704.664666
SAR 4.405169
SBD 9.627676
SCR 17.900779
SDG 706.500204
SEK 11.053641
SGD 1.507078
SHP 0.923017
SLE 27.371479
SLL 24629.872108
SOS 672.046646
SRD 44.746506
STD 24310.953338
STN 24.498055
SVC 10.290183
SYP 15271.347995
SZL 20.40538
THB 37.403804
TJS 11.007526
TMT 4.110949
TND 3.421528
TOP 2.750934
TRY 48.533117
TTD 7.959368
TWD 35.508069
TZS 2901.86962
UAH 48.583443
UGX 4118.673018
USD 1.174557
UYU 46.976271
UZS 14481.850282
VES 191.972897
VND 30987.7435
VUV 139.949809
WST 3.137227
XAF 655.904928
XAG 0.027266
XAU 0.000319
XCD 3.174299
XCG 2.119432
XDR 0.815735
XOF 655.904928
XPF 119.331742
YER 281.248041
ZAR 20.369493
ZMK 10572.424443
ZMW 27.806792
ZWL 378.206795
  • AEX

    -3.3600

    929.94

    -0.36%

  • BEL20

    10.8100

    4709.11

    +0.23%

  • PX1

    -0.7900

    7853.59

    -0.01%

  • ISEQ

    -35.8800

    11176.65

    -0.32%

  • OSEBX

    -5.6100

    1645.65

    -0.34%

  • PSI20

    -21.6300

    7704.09

    -0.28%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    33.2300

    3494.96

    +0.96%

  • N150

    -13.5900

    3659.77

    -0.37%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

L.Bartos--TPP