Kanibalizacja sprzedaży papierowych książek. Nowy program pomoże w generowaniu audiobooków

Dzięki zastosowaniu sztucznej inteligencji, potrafiącej zamieniać tekst na mowę, Projekt Gutenberg (inicjatywa polegająca na publikowaniu w internecie elektronicznych wersji książek istniejących w wersji papierowej) wyda pięć tysięcy bezpłatnych audiobooków. Badania wskazują, że spada sprzedaż wersji papierowych na rzecz książek audio.

Audiobooki zyskują coraz większą popularność. Według raportu Biblioteki Narodowej w 2022 roku osiem procent Polaków deklarowało, że słucha książek audio, choć obecnie ich nagrywanie jest trudne i kosztowne. Naukowcy zademonstrowali niedawno zautomatyzowaną metodę przetwarzanie tekstu na mowę. Dzięki niej każdy internauta będzie mógł wybrać książkę, głos lektora (także swój własny) i odsłuchać wygenerowaną w ten sposób lekturę.

Projekt Gutenberg już dziś bezpłatnie udostępnia tysiące audiobooków z literaturą klasyczną i materiałami, których nie chronią prawa autorskie (domena publiczna). Specjaliści z Microsoftu i MIT (Massachusetts Institute of Technology) skanowali książki, a specjalne oprogramowanie przetworzyło uzyskany tekst na mowę, która brzmi naturalnie.

W wirtualnej bibliotece książek audio są dzieła Szekspira, Agathy Christie, Jane Austen, Leonarda Da Vinci i wielu innych autorów. Zainteresowani mogą je znaleźć m.in. w Internet Archive, Spotify, Apple Podcasts i Google Podcasts.

Komercyjne podejście nie zawsze się opłaca

Apple rozpoczął sprzedaż audiobooków w styczniu bieżącego roku. Generował je za pomocą własnej aplikacji do automatycznego przetwarzania słowa pisanego na mowę. Przedsięwzięcie zostało szczegółowo przeanalizowane i skrytykowane w środowisku autorów i aktorów, którzy udzielali swojego głosu i szkolili w ten sposób AI. Specjalistom nie spodobało się komercyjne podejście korporacji do upowszechniania literatury. Inaczej może być w przypadku Gutenberga, który stawia na open source.

W ramach Projektu Gutenberg przez wiele lat gromadzono książki w formacie elektronicznym. Głównym celem przedsięwzięcia było upowszechnienie dostępu do literatury. Podobnie ma być z audiobookami: pomagają one czytelnikom, którzy prowadzą samochód, biegają, spacerują, wykonują wiele zadań jednocześnie, są niedowidzący, uczą się czytać lub uczą się nowego języka.

Opracowywanie książek audio tradycyjnymi metodami wymaga czasu i pieniędzy: należy zapłacić komuś za przeczytanie całej lektury na głos. Takie nagrywanie zwyczajnie się nie opłaca. Zautomatyzowana zamiana tekstu na mowę sprawia, że koszty są dużo niższe.

Wiele przeszkód

Badacze musieli rozwiązać kilka problemów, zanim ich aplikacja zaczęła poprawnie funkcjonować. Najważniejsze było określenie, które książki mogą być analizowane przez cyfrowe oprogramowanie. W ramach Projektu Gutenberg gromadzi się materiały w wielu formatach, a pliki często zawierają błędy lub niedoskonałe skany. Dlatego badacze skupili się na książkach przechowywanych w plikach HTML.

Eksperci musieli się też upewnić, że system wie, który tekst przeczytać, a który zignorować. Dotyczyło to takich elementów, jak spisy treści, numery stron, przypisy, tabele i inne dodatkowe materiały.

Polecamy:

Odbiorca powinien też z przyjemnością słuchać brzmienia głosu sztucznej inteligencji. Dlatego badacze skupili się na przekazie wokalnym najlepiej pasującym do dzieł literatury faktu. Użytkownicy mogą jednak dostosować oprogramowanie i posłuchać bardziej emocjonalnych odczytów oraz wybierać lektora z katalogu głosów syntetycznych.

Naukowcy chcą też dać wszystkim możliwość wygenerowania audiobooka na podstawie własnej mowy. Wystarczy kilka linijek nagranego tekstu do wytrenowania algorytmu, aby program mówił podobnym do nas głosem.

Rozpowszechnianie dzieł literatury znajdujących się w domenie publicznej jest bardzo pozytywnym zjawiskiem. Ułatwianie dostępu do treści daje nadzieję, że mimo spadającego czytelnictwa, nie stanie się ono w przyszłości całkowicie zapomniane. Audiobooki nie zastąpią tradycyjnych książek, mogą jednak w znaczący sposób wpłynąć na postawy odbiorców na całym świecie oraz zachęcić wiele osób do czytania.

Posłuchaj przykładowego audiobooka opublikowanego przez Projekt Gutenberg:

Zobacz też:

Fot. Karolina Grabowska / Pexels

Opublikowano przez

Rafał Cieniek

Autor


Idealista wierzący w miłość, prawdę i dobro, których szuka na świecie i wokół siebie. Mimo to starający się racjonalnie patrzeć na człowieka i rzeczywistość. Od kilkunastu lat związany z mediami elektronicznymi, gdzie był autorem, redaktorem i wydawcą. Lubi być zaskakiwany nowymi odkryciami naukowców, czytać i pisać o rozwoju technologii, historii, społeczeństwie, etyce i filozofii. Ma doktorat z nauk o mediach.

Chcesz być na bieżąco?

Zapisz się na naszą listę mailingową. Będziemy wysyłać Ci powiadomienia o nowych treściach w naszym serwisie i podcastach.
W każdej chwili możesz zrezygnować!

Nie udało się zapisać Twojej subskrypcji. Proszę spróbuj ponownie.
Twoja subskrypcja powiodła się.