Ciekawostki

Nowe technologie: rozpoznawanie mowy

rozpoznawanie mowy

Czy pamiętacie, jakim udogodnieniem był OCR (czyli przerabianie tekstu nieaktywnego w aktywny przy pomocy odpowiedniego programu na komputerze)? Nie? To przypominamy: skanowało się dokument drukowany, a technologia OCR przerabiała go na tekst edytowalny, np. do Worda. Technologia ta pojawiła się dobre kilkanaście lat temu, a dziś jest to już normalną funkcją większości skanerów (lub programów „OCR” dostępnych online).

Jeszcze kilka lat temu niewielu się spodziewało, że czymś normalnym stanie się widok kierowcy mówiącego do samochodowego GPS-a i opisującego trasę. Obecnie jest to już czynność oczywista, podobnie jak głosowe „pisanie” SMS-ów. Aplikacje konwertujące mowę na tekst stały się powszechne.

Jednak służą one nie tylko kierowcom, dziennikarzom i przeciętnym zjadaczom chleba, ale okazują się również bardzo pomocne dla osób mających problemy ze słuchem, zwłaszcza dla osób głuchoniemych. Można śmiało stwierdzić, że osoby tłumaczące tekst filmowy lub wypowiedź publiczną na język migowy będą miały coraz mniej roboty. Tym bardziej, że tłumaczenia niektórych seriali przez tłumaczy języka migowego nie są zbyt zrozumiałe nawet dla części osób głuchych.

Osoby głuche lub niedosłyszący będą mieli łatwiej

Jeśli chodzi o statystyki, to osoby głuche stanowią spory procent ludzkiej populacji. Światowa Organizacja Zdrowia podaje, że na świecie jest około 466 milionów ludzi z utratą słuchu lub z postępującą głuchotą. Polski Związek Głuchych zrzesza około 100 000 osób, jednak problemy ze słuchem ma aż około 900 000 Polaków. U części z nich słuch się pogarsza nieodwracalnie w miarę starzenia.

Dodatkowym problemem osób głuchych od urodzenia jest przyswajanie rodzimego języka, co w ich wypadku wymaga dużo większego wysiłku niż u osoby słyszącej. Dlatego totalną rewolucją, znacznie ułatwiającą życie osobom głuchym są aplikacje konwertujące ludzki głos na tekst i to w czasie rzeczywistym.

Pomocne w tym względzie są oczywiście smartfony i inne urządzenia mobilne. Jedną z aplikacji konwertujących ludzką mowę na tekst przygotowała znana wszystkim firma Google. Jest to, działający na telefonach z systemem Android 5.0+ lub iOS – Live Transcribe. Aplikacja dysponuje siedemdziesięcioma językami, umożliwia jednocześnie wykorzystanie specjalnego wzmacniacza dźwięków sprzężonego z mikrofonem smartfona. Wzmacniacz pozwala na prowadzenie rozmowy w hałaśliwym otoczeniu eliminując odgłosy niepotrzebne. Istotnym walorem wzmacniacza jest możliwość personalizacji wrażeń słuchowych, dzięki możliwości dostosowania ustawień dźwięku i mikrofonu do własnych potrzeb, czy ograniczenie niepożądanych lub rozpraszających dźwięków – z funkcji tej skorzystają głównie osoby niedosłyszące.

Ułatwiający życie osobom głuchym może być także moduł Speak See (w postaci zgrabnego urządzenia przenośnego mniejszego niż telefon), który wykorzystuje kilka mikrofonów po to by bardziej tekst wygładzić i ujednolicić. Efekt zapisywany jest w pamięci.

Nie tylko smartfony

Konwertowanie mowy na tekst potrzebne jest osobom głuchym nie tylko podczas osobistych i bezpośrednich rozmów. Przecież część osób głuchych uczestniczy też w konferencjach, warsztatach lub wykładach. I w tym kontekście warto jest posłużyć się przykładem wykorzystania w tym celu sztucznej inteligencji.

Jest to technologia nazwana Microsoft Translator dająca między innymi możliwość odczytywania treści prezentacji multimedialnej w czasie rzeczywistym, konwertując na tekst głos osoby prowadzącej. Technologia ta jest ciągle doskonalona, twórcy dążą do tego by konwertowany tekst nie posiadał nawet najdrobniejszych błędów.

To tylko niektóre przykłady nowoczesnych rozwiązań ułatwiających osobom głuchym i niedosłyszącym porozumiewanie się. Chodzi przede wszystkim o to, by mieć świadomość rosnących w tej dziedzinie możliwości. Tak naprawdę wszyscy mamy w dzisiejszych czasach możliwość wykorzystywania całkiem dużej ilości aplikacji konwertujących mowę na tekst. Część z nim można wykorzystywać bezpłatnie, na przykład – SkryBot doMowy, Dictation Pro lub Dictate. Jeśli znacie jakieś fajne narzędzia, których zabrakło w artykule, wpisujcie w komentarzach.

Źródła:
Bimkal.pl, Bibliofilembyc.pl. antyweb.pl, komputerswiat.pl

Wpisz treść tutaj