The Prague Post - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.300395
AFN 73.771059
ALL 95.492494
AMD 434.89817
ANG 2.095907
AOA 1074.953577
ARS 1644.938934
AUD 1.634616
AWG 2.109216
AZN 1.987981
BAM 1.958138
BBD 2.357996
BDT 143.970693
BGN 1.953303
BHD 0.441779
BIF 3483.645619
BMD 1.170973
BND 1.494872
BOB 8.089626
BRL 5.850417
BSD 1.170688
BTN 110.624157
BWP 15.833773
BYN 3.303116
BYR 22951.07702
BZD 2.354602
CAD 1.60219
CDF 2719.585571
CHF 0.923494
CLF 0.026528
CLP 1044.062825
CNY 8.006471
CNH 8.006964
COP 4232.635282
CRC 532.531374
CUC 1.170973
CUP 31.030793
CVE 110.541334
CZK 24.360698
DJF 208.105235
DKK 7.473618
DOP 69.380325
DZD 155.173427
EGP 61.862199
ERN 17.5646
ETB 184.281899
FJD 2.576488
FKP 0.864136
GBP 0.866514
GEL 3.155807
GGP 0.864136
GHS 13.044631
GIP 0.864136
GMD 86.133089
GNF 10278.215614
GTQ 8.944605
GYD 244.932486
HKD 9.177327
HNL 31.171228
HRK 7.533928
HTG 153.361827
HUF 363.996829
IDR 20276.573963
ILS 3.461361
IMP 0.864136
INR 110.910966
IQD 1533.975046
IRR 1541000.885095
ISK 143.198065
JEP 0.864136
JMD 184.460273
JOD 0.830222
JPY 186.903149
KES 151.176503
KGS 102.377731
KHR 4695.603381
KMF 492.97925
KPW 1053.871083
KRW 1728.280527
KWD 0.36018
KYD 0.975657
KZT 536.626229
LAK 25697.009943
LBP 104850.588697
LKR 373.172437
LRD 215.166524
LSL 19.362015
LTL 3.45758
LVL 0.70831
LYD 7.429809
MAD 10.838821
MDL 20.248006
MGA 4858.368407
MKD 61.641492
MMK 2459.090039
MNT 4211.235716
MOP 9.450044
MRU 46.838679
MUR 54.777669
MVR 18.091763
MWK 2038.664498
MXN 20.372418
MYR 4.626554
MZN 74.836877
NAD 19.379494
NGN 1610.04165
NIO 42.992293
NOK 10.920567
NPR 176.998852
NZD 1.998887
OMR 0.450237
PAB 1.170693
PEN 4.117123
PGK 5.087586
PHP 72.020714
PKR 326.379512
PLN 4.249872
PYG 7338.700835
QAR 4.266148
RON 5.09561
RSD 117.421743
RUB 88.20729
RWF 1710.20653
SAR 4.392081
SBD 9.398156
SCR 16.001437
SDG 703.173879
SEK 10.855111
SGD 1.495093
SHP 0.87425
SLE 28.835202
SLL 24554.720488
SOS 669.207686
SRD 43.870506
STD 24236.783483
STN 24.883183
SVC 10.244146
SYP 129.450246
SZL 19.37966
THB 38.18662
TJS 10.981514
TMT 4.104261
TND 3.376795
TOP 2.819423
TRY 52.775901
TTD 7.960438
TWD 36.947137
TZS 3053.456924
UAH 51.59397
UGX 4355.163524
USD 1.170973
UYU 46.204781
UZS 14133.64802
VES 567.475409
VND 30855.146912
VUV 138.439027
WST 3.194196
XAF 656.735632
XAG 0.015868
XAU 0.000255
XCD 3.164614
XCG 2.109902
XDR 0.817009
XOF 655.16
XPF 119.331742
YER 279.452944
ZAR 19.385053
ZMK 10540.165858
ZMW 22.21243
ZWL 377.05293
  • AEX

    -7.8700

    1001.01

    -0.78%

  • BEL20

    -20.8900

    5334.76

    -0.39%

  • PX1

    -37.4500

    8104.09

    -0.46%

  • ISEQ

    64.7800

    12286.69

    +0.53%

  • OSEBX

    6.7500

    1993.31

    +0.34%

  • PSI20

    87.1900

    9265.14

    +0.95%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -55.5400

    3883.5

    -1.41%

  • N150

    0.8200

    4105.76

    +0.02%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

E.Cerny--TPP