The Prague Post - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.177613
AFN 80.776958
ALL 98.674291
AMD 442.254844
ANG 2.049839
AOA 1041.815217
ARS 1325.015571
AUD 1.77753
AWG 2.050078
AZN 1.930861
BAM 1.954283
BBD 2.277932
BDT 138.142794
BGN 1.956115
BHD 0.428723
BIF 3381.475805
BMD 1.137352
BND 1.489844
BOB 7.855869
BRL 6.392603
BSD 1.136928
BTN 96.840421
BWP 15.522091
BYN 3.720713
BYR 22292.106206
BZD 2.283828
CAD 1.574386
CDF 3273.299627
CHF 0.936661
CLF 0.028029
CLP 1075.582507
CNY 8.267979
CNH 8.266601
COP 4773.467844
CRC 574.769111
CUC 1.137352
CUP 30.139837
CVE 110.179011
CZK 24.924961
DJF 202.462879
DKK 7.464893
DOP 66.999772
DZD 150.740411
EGP 57.771771
ERN 17.060285
ETB 152.189631
FJD 2.605106
FKP 0.849211
GBP 0.849329
GEL 3.121981
GGP 0.849211
GHS 16.258311
GIP 0.849211
GMD 81.322521
GNF 9847.271442
GTQ 8.756166
GYD 238.573806
HKD 8.823421
HNL 29.504363
HRK 7.53724
HTG 148.764551
HUF 404.313979
IDR 19017.555034
ILS 4.12516
IMP 0.849211
INR 96.949905
IQD 1489.444117
IRR 47882.534347
ISK 146.081688
JEP 0.849211
JMD 180.101815
JOD 0.806612
JPY 161.979428
KES 146.946635
KGS 99.461261
KHR 4551.427846
KMF 491.620598
KPW 1023.732863
KRW 1625.236725
KWD 0.348326
KYD 0.947465
KZT 581.578666
LAK 24591.915438
LBP 101870.04373
LKR 340.575696
LRD 227.392532
LSL 21.096928
LTL 3.358306
LVL 0.687973
LYD 6.220173
MAD 10.546369
MDL 19.566815
MGA 5131.063151
MKD 61.575461
MMK 2388.195606
MNT 4063.055995
MOP 9.08475
MRU 45.011465
MUR 51.407236
MVR 17.515996
MWK 1971.487361
MXN 22.252725
MYR 4.908247
MZN 72.801774
NAD 21.096928
NGN 1821.492028
NIO 41.837532
NOK 11.805172
NPR 154.949838
NZD 1.9184
OMR 0.437884
PAB 1.136913
PEN 4.168365
PGK 4.710324
PHP 63.575149
PKR 319.398439
PLN 4.267346
PYG 9104.934114
QAR 4.144765
RON 4.977848
RSD 117.109117
RUB 93.263383
RWF 1625.253012
SAR 4.266304
SBD 9.509741
SCR 16.177403
SDG 682.98601
SEK 10.969993
SGD 1.48723
SHP 0.89378
SLE 25.875339
SLL 23849.691791
SOS 649.801435
SRD 41.911684
STD 23540.897494
SVC 9.94828
SYP 14787.811104
SZL 21.089819
THB 38.01543
TJS 12.005819
TMT 3.992107
TND 3.400946
TOP 2.663793
TRY 43.778882
TTD 7.714014
TWD 36.458396
TZS 3059.478312
UAH 47.234259
UGX 4166.748076
USD 1.137352
UYU 47.871797
UZS 14721.575318
VES 98.435697
VND 29576.848055
VUV 137.968789
WST 3.15057
XAF 655.454098
XAG 0.034511
XAU 0.000344
XCD 3.073752
XDR 0.815175
XOF 655.448339
XPF 119.331742
YER 278.708486
ZAR 21.117949
ZMK 10237.534291
ZMW 31.806317
ZWL 366.226995
  • AEX

    2.0100

    874.74

    +0.23%

  • BEL20

    43.7600

    4376.51

    +1.01%

  • PX1

    -18.1800

    7555.87

    -0.24%

  • ISEQ

    165.4400

    10377.75

    +1.62%

  • OSEBX

    4.8400

    1472.35

    +0.33%

  • PSI20

    94.1600

    6967.27

    +1.37%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    51.5000

    2805.66

    +1.87%

  • N150

    19.5700

    3393.83

    +0.58%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

E.Cerny--TPP