Magda i Natan dwa polskie głosy dla syntezatora mowy RHVoice
Opublikowane w: Aktualności ze świata technologii asystujących
Autor: Sylwester Piekarski - s.piekarski@uw.edu.pl, Dodane w dniu: 12-05-2022
Magda i Natan to dwa nowe polskie głosy dla syntezatora RHVoice udostępnione na licencji Creativecommons, co oznacza, że można z nich korzystać za darmo do użycia niekomercyjnego.
(Zrzut ekranu – strona projektu RHVoice)
RHVoice jest darmowym silnikiem dla syntetycznych głosów o otwartym kodzie napisanym przez niewidomą programistkę Olgę Yakovleve. Więcej o nim można przeczytać na oficjalnej stronie projektu dostępnej pod adresem https://rhvoice.org.
Dla RHVoice zostało już stworzonych kilkanaście głosów dla różnych języków. Ich aktualną listę znajdziemy na powyższej stronie po wybraniu zakładki Languages.
Osoby zainteresowane RHVoice wszystkie informacje na jego temat znajdą na platformie Github w tym miejscu https://github.com/RHVoice.
Informacje o tym jak stworzyć nowy głos dla tego silnika można przeczytać tutaj https://github.com/RHVoice/RHVoice/wiki. Tu trzeba podziękować polskiemu programiście Grzegorzowi Złotowiczowi za stworzenie tej dokumentacji.
RHVoice może być instalowany na trzech systemach Android, Linux i Windows. Syntezator w postaci dodatku wspiera również darmowy czytnik NVDA.
W systemie Linux RHVoice może współpracować z czytnikiem Orca a w Windows obsługuje interfejs Microsoft SAPI5.
(Zrzut ekranu – strona projektu Magdy i Natana)
Na początku tego roku powstały dwa głosy języka polskiego dla syntezatora RHVoice, o nazwie Magda i Natan. Ich brzmienie jest dość naturalne, ale jakością odbiegają od obecnych standardów syntetycznej mowy. Można je jednak bez problemu zrozumieć i używać w codziennej pracy. Zaletą tych głosów jest to, że są darmowe do zastosowań niekomercyjnych, nie wymagają dużych zasobów sprzętowych, działają bez opóźnień i nie posiadają własnej interpretacji skrótów, co w przypadku syntezatorów mowy firm komercyjnych jest częstą praktyką. Zaletą Magdy i Natana jest także umiejętność mówienia gwarą śląską i językiem Kaszubskim – to na dzień dzisiejszy jedyne głosy, które to potrafią.
W dniu pisania tego artykułu głosy Magda i Natan były dostępne dla systemu Windows i Android. W przypadku Linuxa uruchomienie ich jest trudniejsze ponieważ trzeba samemu sobie je skompilować. O tym jak to zrobić można przeczytać tutaj https://github.com/RHVoice/RHVoice/blob/master/doc/en/Compiling-on-Linux.md.
W systemie Android głosy współpracują z czytnikami ekranu oraz z programami używającymi interfejsu TTS. W Windowsach wspierany jest interfejs SAPI5 co pozwala na współpracę z nimi zarówno czytnikom ekranu jak i programom używających tego interfejsu. Przykładem takich programów są opisywane w naszym serwisie Balabolka i Bookworm.
Głosy te działają także w instalowanym dla NVDA dodatku RHVoice.
Magdę i Natana w wersji dla Windows i w postaci dodatku dla NVDA można pobrać z polskiej strony projektu dostępnej pod adresem https://www.zlotowicz.pl/synteza.
W systemie Android trzeba najpierw zainstalować silnik RHVoice, który można pobrać tutaj a następnie bezpośrednio z niego instalujemy wybrane głosy.
Parametry pracy RHVoice można zmieniać z poziomu czytnika ekranu i dodatkowo po przez stworzenie dla niego specjalnego pliku konfiguracyjnego. Opis tworzenia takiego pliku i wartości parametrów, których możemy w nim użyć jest dostępny w serwisie Github na tej podstronie https://github.com/RHVoice/RHVoice/blob/master/doc/en/Configuration-file.md.
Zarówno RHVoice jak i polskie głosy zostały przyjęte przez polską społeczność osób niewidomych z dużym entuzjazmem. Co niektóre osoby na liście dyskusyjnej Typhlos pisały nawet, że głosy te są lepsze niż dedykowane czytnikom ekranu głosy Vocalizer. Wygląda więc na to, że osoby niewidome czekały na taki produkt. Nie obeszło się jednak bez krytyki, okazało się bowiem, że RHVoice automatycznie odczytuje emotikonki i funkcji tej na razie nie można wyłączyć. Nie wszystkim użytkownikom RHVoice takie zachowanie syntezatora się podoba.
Na temat syntezatora RHVoice i tworzonych dla niego głosów pomoc można uzyskać na liście dyskusyjnej Typhlos oraz na powstałej specjalnie dla tego projektu liście dyskusyjnej RHVoice. Na listę poświęconą RHVoice zapiszemy się wysyłając maila na adres rhvoice-pl+subscribe@groups.io. Natomiast wiadomości wysyłamy pisząc na adres rhvoice-pl@groups.io. Pierwsza wiadomość wysłana na listę wymaga potwierdzenia jej przez administratora grupy.