The Prague Post - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.243687
AFN 80.258579
ALL 97.948265
AMD 440.592197
ANG 2.067962
AOA 1058.465478
ARS 1362.804464
AUD 1.778285
AWG 2.082842
AZN 1.968988
BAM 1.955765
BBD 2.322859
BDT 140.58751
BGN 1.96051
BHD 0.433992
BIF 3425.439333
BMD 1.15553
BND 1.477574
BOB 7.949859
BRL 6.406145
BSD 1.15048
BTN 98.998247
BWP 15.463726
BYN 3.764933
BYR 22648.378878
BZD 2.310959
CAD 1.569961
CDF 3324.458889
CHF 0.938796
CLF 0.027884
CLP 1070.051049
CNY 8.298556
CNH 8.307576
COP 4778.715365
CRC 579.88973
CUC 1.15553
CUP 30.621533
CVE 110.263047
CZK 24.84493
DJF 204.866372
DKK 7.461301
DOP 67.948797
DZD 150.258339
EGP 57.438983
ERN 17.332943
ETB 155.208151
FJD 2.59792
FKP 0.851372
GBP 0.852443
GEL 3.166602
GGP 0.851372
GHS 11.84979
GIP 0.851372
GMD 81.469282
GNF 9968.823444
GTQ 8.840843
GYD 240.695737
HKD 9.070618
HNL 30.026468
HRK 7.537177
HTG 150.877328
HUF 402.707866
IDR 18834.322544
ILS 4.160155
IMP 0.851372
INR 99.58874
IQD 1507.073308
IRR 48647.793814
ISK 144.037202
JEP 0.851372
JMD 184.196738
JOD 0.819316
JPY 166.507229
KES 148.637368
KGS 101.051502
KHR 4612.918301
KMF 492.837731
KPW 1039.976573
KRW 1579.771091
KWD 0.353847
KYD 0.958683
KZT 590.089549
LAK 24822.560372
LBP 103080.774354
LKR 344.473899
LRD 230.095925
LSL 20.704233
LTL 3.411979
LVL 0.698969
LYD 6.285889
MAD 10.518914
MDL 19.701651
MGA 5194.907994
MKD 61.53391
MMK 2426.268419
MNT 4138.767016
MOP 9.301035
MRU 45.673191
MUR 52.588586
MVR 17.800977
MWK 1994.864669
MXN 21.910925
MYR 4.905805
MZN 73.89655
NAD 20.704233
NGN 1782.335411
NIO 42.33925
NOK 11.468204
NPR 158.397195
NZD 1.914238
OMR 0.444022
PAB 1.15048
PEN 4.152526
PGK 4.805915
PHP 64.814084
PKR 326.153924
PLN 4.273513
PYG 9179.837417
QAR 4.196726
RON 5.027136
RSD 117.197924
RUB 92.187067
RWF 1661.270578
SAR 4.337388
SBD 9.645657
SCR 16.420505
SDG 693.899733
SEK 10.950611
SGD 1.481278
SHP 0.908065
SLE 25.479855
SLL 24230.88081
SOS 657.488355
SRD 43.364756
STD 23917.128362
SVC 10.066822
SYP 15024.024763
SZL 20.690634
THB 37.444978
TJS 11.619594
TMT 4.044353
TND 3.40414
TOP 2.70637
TRY 45.493623
TTD 7.801862
TWD 34.111657
TZS 2973.947329
UAH 47.720955
UGX 4145.926572
USD 1.15553
UYU 47.299162
UZS 14617.741108
VES 118.057029
VND 30130.432615
VUV 137.626073
WST 3.026547
XAF 655.945383
XAG 0.031814
XAU 0.000336
XCD 3.122877
XDR 0.815786
XOF 655.945383
XPF 119.331742
YER 281.198532
ZAR 20.738243
ZMK 10401.156591
ZMW 27.812507
ZWL 372.080039
  • AEX

    -7.8200

    922.62

    -0.84%

  • BEL20

    -42.4800

    4476.21

    -0.94%

  • PX1

    -80.7600

    7684.68

    -1.04%

  • ISEQ

    -183.8900

    11454.53

    -1.58%

  • OSEBX

    11.1500

    1627.37

    +0.69%

  • PSI20

    -51.9400

    7475.67

    -0.69%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -15.7900

    2615.73

    -0.6%

  • N150

    -32.5300

    3582.26

    -0.9%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

E.Cerny--TPP