Czytnik ekranu - Screen reader

Przykład osoby korzystającej z czytnika ekranu pokazującego dokumenty, które są niedostępne, czytelne i dostępne.

Czytnik ekranu jest formą technologii wspierających ( AT ), który powoduje, tekstu i obrazu o jak mowa lub wyjścia Braille'a. Czytniki ekranu są niezbędne dla osób niewidomych i są przydatne dla osób niedowidzących , niepiśmiennych lub mających trudności w nauce . Czytniki ekranu to aplikacje, które próbują przekazać użytkownikom to, co osoby o normalnym wzroku widzą na ekranie, za pomocą środków niewizualnych, takich jak zamiana tekstu na mowę , ikony dźwiękowe lub urządzenie brajlowskie. Robią to, stosując szeroką gamę technik, które obejmują na przykład interakcję z dedykowanymi interfejsami API ułatwień dostępu , korzystając z różnych funkcji systemu operacyjnego (takich jak komunikacja między procesami i odpytywanie właściwości interfejsu użytkownika ) oraz stosując techniki zaczepiania .

Systemy operacyjne Microsoft Windows zawierają czytnik ekranu Microsoft Narrator od systemu Windows 2000 , chociaż oddzielne produkty, takie jak dostępny na rynku czytnik ekranu JAWS i lupa ZoomText firmy Freedom Scientific, oraz bezpłatny i otwarty czytnik ekranu NVDA firmy NV Access są bardziej popularne w tym celu. system operacyjny. Apple Inc. 's MacOS , iOS i tvOS obejmują VoiceOver jak wbudowany czytnik ekranu, podczas gdy Google ' s Android zapewnia czytnik ekranu TalkBack a jego Chrome OS mogą korzystać z ChromeVox. Podobnie urządzenia z systemem Android firmy Amazon zapewniają czytnik ekranu VoiceView. Istnieją również bezpłatne i otwarte czytniki ekranu dla systemów Linux i Unix , takich jak Speakup i Orca .

Rodzaje

Wiersz poleceń (tekst)

We wczesnych systemach operacyjnych , takich jak MS-DOS , które wykorzystywały interfejsy wiersza poleceń ( CLI ), wyświetlanie ekranu składało się z mapowania znaków bezpośrednio do bufora ekranu w pamięci i pozycji kursora . Wejście odbywało się za pomocą klawiatury. Wszystkie te informacje można zatem uzyskać z systemu albo przez podłączenie przepływu informacji w systemie i odczytanie bufora ekranu, albo przez użycie standardowego gniazda wyjściowego sprzętu i przekazanie wyników użytkownikowi.

W latach 80. Centrum Badań Edukacji Osób Niepełnosprawnych Wizualnie ( RCEVH ) na Uniwersytecie w Birmingham opracowało czytnik ekranu dla BBC Micro i NEC Portable.

Graficzny

Modele poza ekranem

Wraz z pojawieniem się graficznych interfejsów użytkownika ( GUI ) sytuacja stała się bardziej skomplikowana. GUI ma znaków i grafiki na ekranie są kreślone na poszczególnych pozycjach, a więc nie ma czysto tekstowa reprezentacja graficznych zawartości wyświetlacza. Czytniki ekranu zostały zatem zmuszone do zastosowania nowych technik niskiego poziomu, zbierając komunikaty z systemu operacyjnego i wykorzystując je do zbudowania „modelu pozaekranowego”, reprezentacji wyświetlacza, na którym przechowywana jest wymagana treść tekstowa.

Na przykład system operacyjny może wysyłać komunikaty, aby narysować przycisk polecenia i jego podpis. Wiadomości te są przechwytywane i wykorzystywane do budowy modelu pozaekranowego. Użytkownik może przełączać się między kontrolkami (takimi jak przyciski) dostępnymi na ekranie, a podpisy i zawartość kontrolki będą odczytywane na głos i/lub wyświetlane na odświeżalnym wyświetlaczu brajlowskim .

Czytniki ekranu mogą również przekazywać informacje o menu, kontrolkach i innych konstrukcjach wizualnych, aby umożliwić niewidomym użytkownikom interakcję z tymi konstrukcjami. Jednak utrzymanie modelu poza ekranem jest poważnym wyzwaniem technicznym; chwytanie wiadomości niskiego poziomu i utrzymywanie dokładnego modelu to trudne zadania.

Interfejsy API ułatwień dostępu

Projektanci systemów operacyjnych i aplikacji podjęli próbę rozwiązania tych problemów, udostępniając czytnikom ekranu sposoby uzyskiwania dostępu do zawartości ekranu bez konieczności utrzymywania modelu poza ekranem. Obejmują one zapewnienie alternatywnych i dostępnych reprezentacji tego, co jest wyświetlane na ekranie, do którego uzyskuje się dostęp za pośrednictwem interfejsu API . Istniejące API obejmują:

Czytniki ekranu mogą wysyłać zapytania do systemu operacyjnego lub aplikacji o to, co jest aktualnie wyświetlane, i otrzymywać aktualizacje, gdy zmieni się wyświetlanie. Na przykład czytnik ekranu może zostać poinformowany, że bieżący fokus znajduje się na przycisku, a jego podpis ma zostać przekazany użytkownikowi. Takie podejście jest znacznie łatwiejsze dla twórców czytników ekranu, ale zawodzi, gdy aplikacje nie są zgodne z API ułatwień dostępu : na przykład Microsoft Word nie jest zgodny z API MSAA , więc czytniki ekranu muszą nadal utrzymywać model pozaekranowy dla programu Word lub znajdź inny sposób na dostęp do jego zawartości. Jednym z podejść jest wykorzystanie dostępnych komunikatów systemu operacyjnego i modeli obiektów aplikacji w celu uzupełnienia API dostępności .

Można założyć, że czytniki ekranu mają dostęp do wszystkich wyświetlanych treści, które nie są wewnętrznie niedostępne. Przeglądarki internetowe, edytory tekstu, ikony i okna oraz programy pocztowe to tylko niektóre z aplikacji, z których z powodzeniem korzystają użytkownicy czytników ekranu. Jednak zdaniem niektórych użytkowników korzystanie z czytnika ekranu jest znacznie trudniejsze niż korzystanie z GUI, a wiele aplikacji ma specyficzne problemy wynikające z charakteru aplikacji (np. animacje) lub niespełnienia standardów dostępności dla platformy (np. Microsoft Word i aktywna dostępność).

Programy i aplikacje z własnym udźwiękowieniem

Niektóre programy i aplikacje mają wbudowaną technologię udźwiękowienia wraz z ich podstawową funkcjonalnością. Programy te są określane jako samogłosujące i mogą stanowić formę technologii wspomagającej, jeśli mają na celu wyeliminowanie konieczności korzystania z czytnika ekranu.

Oparta na chmurze

Niektóre usługi telefoniczne umożliwiają użytkownikom zdalną interakcję z Internetem. Na przykład TeleTender może czytać strony internetowe przez telefon i nie wymaga specjalnych programów ani urządzeń po stronie użytkownika.

Internetowy

Stosunkowo nowym rozwiązaniem w tej dziedzinie są aplikacje internetowe, takie jak Spoken-Web, które działają jak portale internetowe, zarządzając treściami, takimi jak aktualizacje wiadomości, pogoda, artykuły naukowe i biznesowe dla niedowidzących lub niewidomych użytkowników komputerów. Inne przykłady to ReadSpeaker lub BrowseAloud, które dodają funkcję zamiany tekstu na mowę do treści internetowych. Głównymi odbiorcami takich aplikacji są ci, którzy mają trudności z czytaniem z powodu trudności w uczeniu się lub barier językowych. Chociaż funkcjonalność pozostaje ograniczona w porównaniu z równoważnymi aplikacjami komputerowymi, główną korzyścią jest zwiększenie dostępności wspomnianych stron internetowych podczas przeglądania na publicznych maszynach, na których użytkownicy nie mają uprawnień do instalowania niestandardowego oprogramowania, co daje ludziom większą „wolność wędrowania”.

Wraz z rozwojem smartfonów możliwość słuchania pisemnych dokumentów (tekstowych treści internetowych, dokumentów PDF , e-maili itp.) podczas jazdy samochodem lub podczas podobnej czynności w taki sam sposób, jak słuchanie muzyki, przyniesie korzyści znacznie szerszemu gronu odbiorców niż osoby niedowidzące. Najbardziej znane przykłady to Siri na iOS oraz Google Now i Iris na Androida . Wraz z premierą Galaxy S III , Samsung wprowadził również podobnego inteligentnego osobistego asystenta o nazwie S Voice . W systemie operacyjnym BlackBerry 10 ich smartfon Z30 oferuje również funkcje interakcji głosowej , które są podobne do innych mobilnych systemów operacyjnych .

Funkcjonalność ta zależy od jakości oprogramowania, ale także od logicznej struktury tekstu. Stosowanie nagłówków, interpunkcji, obecność alternatywnych atrybutów obrazów itp. ma kluczowe znaczenie dla dobrej wokalizacji. Również strona internetowa może wyglądać ładnie ze względu na zastosowanie odpowiedniego dwuwymiarowego pozycjonowania za pomocą CSS, ale jej standardowa linearyzacja, na przykład poprzez wyłączenie CSS i Javascript w przeglądarce może być niezrozumiała.

Dostosowywanie

Większość czytników ekranu pozwala użytkownikowi wybrać, czy większość znaków interpunkcyjnych ma być ogłaszana, czy po cichu ignorowana. Niektóre czytniki ekranu można dostosować do konkretnej aplikacji za pomocą skryptów . Jedną z zalet skryptów jest to, że umożliwia udostępnianie dostosowań między użytkownikami, zwiększając dostępność dla wszystkich. Na przykład JAWS cieszy się aktywną społecznością dzielącą się skryptami.

Gadatliwość

Gadatliwość to funkcja oprogramowania do czytania zawartości ekranu, która obsługuje użytkowników komputerów z dysfunkcją wzroku. Kontrolki oznajmiania mowy pozwalają użytkownikom wybrać, ile informacji zwrotnych chcą usłyszeć. W szczególności ustawienia oznajmiania pozwalają użytkownikom na skonstruowanie mentalnego modelu stron internetowych wyświetlanych na ekranie komputera. Na podstawie ustawień szczegółowości czytnik ekranu informuje użytkowników o pewnych zmianach formatowania, takich jak początek i koniec ramki lub tabeli, wstawienie grafiki do tekstu lub pojawienie się listy w dokumencie.

Język

Niektóre czytniki ekranu mogą czytać tekst w więcej niż jednym języku , pod warunkiem, że język materiału jest zakodowany w jego metadanych .

Niektóre programy do czytania ekranu zawierają również funkcję oznajmiania, która automatycznie wykrywa ustawienia oznajmiania związane z językiem wyjściowym mowy. Jeśli na przykład użytkownik przejdzie do witryny z siedzibą w Wielkiej Brytanii, tekst zostanie odczytany z angielskim akcentem .

Zobacz też

Bibliografia

Zewnętrzne linki