The Prague Post - OpenAI donne la vision et la voix à ChatGPT

EUR -
AED 4.334352
AFN 73.760351
ALL 96.444765
AMD 444.793279
ANG 2.112276
AOA 1082.261747
ARS 1662.198606
AUD 1.657868
AWG 2.11997
AZN 2.005575
BAM 1.95769
BBD 2.380018
BDT 144.379419
BGN 1.944584
BHD 0.444947
BIF 3504.60843
BMD 1.18022
BND 1.492773
BOB 8.166051
BRL 6.067159
BSD 1.181556
BTN 107.375596
BWP 15.526859
BYN 3.410308
BYR 23132.305504
BZD 2.376515
CAD 1.613573
CDF 2543.373435
CHF 0.912634
CLF 0.025875
CLP 1021.68078
CNY 8.074356
CNH 8.088931
COP 4445.379997
CRC 559.262416
CUC 1.18022
CUP 31.275821
CVE 110.377052
CZK 24.25233
DJF 210.395841
DKK 7.472708
DOP 71.489336
DZD 153.262131
EGP 56.589412
ERN 17.703295
ETB 183.092778
FJD 2.58828
FKP 0.871006
GBP 0.874908
GEL 3.151606
GGP 0.871006
GHS 12.594068
GIP 0.871006
GMD 86.155844
GNF 10364.828257
GTQ 9.066532
GYD 247.116532
HKD 9.233691
HNL 31.270328
HRK 7.536533
HTG 154.962921
HUF 375.534027
IDR 19808.806918
ILS 3.694412
IMP 0.871006
INR 107.344696
IQD 1547.831207
IRR 1550862.934708
ISK 143.314315
JEP 0.871006
JMD 184.086541
JOD 0.836747
JPY 183.872301
KES 152.248545
KGS 103.210164
KHR 4733.5712
KMF 493.332115
KPW 1062.19366
KRW 1693.314313
KWD 0.361867
KYD 0.984755
KZT 589.581822
LAK 25309.447065
LBP 105792.906167
LKR 365.184184
LRD 216.812118
LSL 18.771606
LTL 3.484882
LVL 0.713903
LYD 7.465103
MAD 10.825762
MDL 20.22962
MGA 4993.603184
MKD 61.641511
MMK 2478.535043
MNT 4212.114198
MOP 9.518532
MRU 47.175755
MUR 54.655881
MVR 18.245808
MWK 2049.137412
MXN 20.287681
MYR 4.588102
MZN 75.421935
NAD 18.771606
NGN 1597.98239
NIO 43.48291
NOK 11.262365
NPR 171.800626
NZD 1.970099
OMR 0.453798
PAB 1.181536
PEN 3.963527
PGK 5.084217
PHP 67.956464
PKR 330.205356
PLN 4.222767
PYG 7610.013021
QAR 4.305794
RON 5.095129
RSD 117.427161
RUB 90.730509
RWF 1722.540654
SAR 4.426224
SBD 9.49901
SCR 16.039694
SDG 709.90253
SEK 10.683295
SGD 1.491756
SHP 0.88547
SLE 28.922206
SLL 24748.615574
SOS 674.05375
SRD 44.608765
STD 24428.164286
STN 24.524201
SVC 10.34103
SYP 130.71041
SZL 18.768442
THB 36.669232
TJS 11.225482
TMT 4.142571
TND 3.399111
TOP 2.841686
TRY 51.881042
TTD 8.017776
TWD 36.937355
TZS 3016.832603
UAH 51.04801
UGX 4253.271095
USD 1.18022
UYU 45.234255
UZS 14329.878228
VES 484.56499
VND 30727.019072
VUV 140.404421
WST 3.203791
XAF 656.593816
XAG 0.01313
XAU 0.000228
XCD 3.189602
XCG 2.129465
XDR 0.816592
XOF 656.602387
XPF 119.331742
YER 281.478398
ZAR 18.778832
ZMK 10623.390413
ZMW 22.121549
ZWL 380.030252
  • AEX

    -7.6200

    1022.4

    -0.74%

  • BEL20

    -177.4800

    5439.05

    -3.16%

  • PX1

    61.6300

    8620.93

    +0.72%

  • ISEQ

    200.9100

    13163.04

    +1.55%

  • OSEBX

    -7.3400

    1875.3

    -0.39%

  • PSI20

    -27.8900

    9267.91

    -0.3%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -265.7400

    3892.91

    -6.39%

  • N150

    -5.7500

    4100.96

    -0.14%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

L.Bartos--TPP