The Prague Post - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.268611
AFN 77.172349
ALL 96.75238
AMD 444.681134
ANG 2.080528
AOA 1065.845045
ARS 1577.880633
AUD 1.783832
AWG 2.093625
AZN 1.979204
BAM 1.954846
BBD 2.340058
BDT 141.460983
BGN 1.954618
BHD 0.438137
BIF 3424.12942
BMD 1.162318
BND 1.506059
BOB 8.028083
BRL 6.350089
BSD 1.161833
BTN 102.510986
BWP 16.540859
BYN 3.957352
BYR 22781.431287
BZD 2.33676
CAD 1.632208
CDF 2725.635533
CHF 0.93036
CLF 0.028458
CLP 1116.403565
CNY 8.297785
CNH 8.289204
COP 4561.911876
CRC 585.214483
CUC 1.162318
CUP 30.801425
CVE 110.210756
CZK 24.27803
DJF 206.899057
DKK 7.468695
DOP 73.224275
DZD 151.512807
EGP 55.391195
ERN 17.434769
ETB 171.588684
FJD 2.641712
FKP 0.872763
GBP 0.870535
GEL 3.161686
GGP 0.872763
GHS 13.187566
GIP 0.872763
GMD 84.849434
GNF 10083.080619
GTQ 8.898658
GYD 243.041424
HKD 9.035104
HNL 30.515112
HRK 7.535772
HTG 152.025829
HUF 390.778197
IDR 19290.874333
ILS 3.8237
IMP 0.872763
INR 102.358424
IQD 1522.057411
IRR 48875.468402
ISK 141.593499
JEP 0.872763
JMD 186.139186
JOD 0.82412
JPY 176.047578
KES 150.113537
KGS 101.643987
KHR 4673.699668
KMF 493.985007
KPW 1046.128156
KRW 1654.623519
KWD 0.356739
KYD 0.968223
KZT 626.29444
LAK 25220.695208
LBP 104044.438306
LKR 351.998265
LRD 212.616268
LSL 20.115486
LTL 3.432023
LVL 0.703074
LYD 6.31392
MAD 10.667096
MDL 19.652327
MGA 5229.448632
MKD 61.606144
MMK 2440.426052
MNT 4179.692823
MOP 9.301122
MRU 46.48632
MUR 52.840011
MVR 17.801552
MWK 2014.317245
MXN 21.452426
MYR 4.918929
MZN 74.283907
NAD 20.115486
NGN 1696.251888
NIO 42.759138
NOK 11.721748
NPR 164.017273
NZD 2.031048
OMR 0.44692
PAB 1.161833
PEN 3.979858
PGK 4.882618
PHP 67.585304
PKR 328.91053
PLN 4.25542
PYG 8208.994957
QAR 4.237133
RON 5.088162
RSD 117.17306
RUB 91.517539
RWF 1686.469942
SAR 4.359123
SBD 9.574387
SCR 15.952844
SDG 699.131391
SEK 11.018747
SGD 1.506719
SHP 0.872039
SLE 27.023589
SLL 24373.225136
SOS 662.873742
SRD 45.307476
STD 24057.634292
STN 24.488053
SVC 10.16604
SYP 15112.584002
SZL 20.105191
THB 37.83868
TJS 10.723968
TMT 4.079736
TND 3.421831
TOP 2.722265
TRY 48.632475
TTD 7.884153
TWD 35.546593
TZS 2850.796262
UAH 48.526025
UGX 4011.043073
USD 1.162318
UYU 46.587271
UZS 14157.09297
VES 228.975118
VND 30615.454087
VUV 142.441817
WST 3.259521
XAF 655.634306
XAG 0.021935
XAU 0.000277
XCD 3.141222
XCG 2.093978
XDR 0.816663
XOF 655.637125
XPF 119.331742
YER 277.619375
ZAR 20.132091
ZMK 10462.247436
ZMW 26.229203
ZWL 374.265897
  • AEX

    6.2700

    955.73

    +0.66%

  • BEL20

    30.2300

    4985.85

    +0.61%

  • PX1

    173.4400

    8092.91

    +2.19%

  • ISEQ

    -13.9400

    11603.86

    -0.12%

  • OSEBX

    11.1000

    1643.17

    +0.68%

  • PSI20

    25.5100

    8254.16

    +0.31%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -37.5700

    3917.3

    -0.95%

  • N150

    12.8600

    3688.45

    +0.35%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

E.Cerny--TPP