Gli ausili: gli screen readers

Germano Carella
(Fondazione Ugo Bordoni)

Con l'avvento degli screen readers (lettori di schermo), si apre ai non vedenti un mondo verso la conoscenza del PC e delle sue funzionalità.
Dalla nascita del personal computer, negli anni 80, viene subito preso in considerazione il problema riguardante quelle persone che, per leggere dei testi sul computer, dovevano avvalersi di mezzi alternativi allo schermo. Per fare questo, occorreva che alcune aziende investissero del tempo e del denaro per trovare un sostituto degno di uno schermo visivo.

Per fare un po' di storia degli screen readers, occorrerà dapprima parlare dei sintetizzatori vocali. Un sintetizzatore vocale è un apparecchio costituito da un generatore di suoni, un processore audio ed un software interno. Quest'ultimo converte i dati ricevuti in fonemi e sillabe che, opportunamente ricostruiti, vengono trasferiti al generatore di suoni che li trasforma in parole.

Uno screen reader è un programma che lavora in background (residente in memoria), che veglia sul sistema operativo attendendo la pressioni di tasti, la focalizzazione di un oggetto, l'attivazione di eventi. Ogni volta che accade una di queste cose, si attiva, prende visione di ciò che è accaduto, memorizza i dati che sono stati modificati, li trasferisce al sintetizzatore, software o hardware, il quale li riproduce vocalmente.

Dalla prima metà degli anni 80 sono presenti sul mercato vari sintetizzatori e vari screen readers per non vedenti. Il primo screen reader introdotto in Italia è "Parla" di Paolo Graziani che, avvalendosi di un sintetizzatore denominato Dfon, ha aiutato molti non vedenti ad utilizzare un PC per scrivere e leggere testi e per programmare.
Parla era molto curato e funzionava con il sistema operativo DOS e su computer come gli "8086" e gli "80286", soprattutto con editor di testo, quali il Writing Assistant dell'IBM ed il Word Star della Micro Pro.
Un altro software, prodotto all'estero, è il filtro vocale, commercializzato dalla PC-Vox, che si avvaleva del supporto di sintetizzatori quali Sa, Apollo ecc.

Vanno poi ricordati anche i Braille Viewers e cioè i visualizzatori braille che, grosso modo, hanno le stesse funzioni degli screen readers ma si avvalgono, anziché di supporti vocali, di apparecchi che riproducono, attraverso dei materiali piezoelettrici, i puntini braille.

Dopo un boom iniziale di queste tecnologie, ci fu un periodo di stallo, poiché si riteneva che i non vedenti, potessero accedere al PC soltanto per la lettura di testi; quindi non era necessario realizzare software più avanzati che permettessero di utilizzare altri applicativi, quali ad esempio i linguaggi di programmazione, i fogli elettronici ecc.

Alla fine ci si rese conto che in molti volevano avere la possibilità di usufruire, per necessità o soltanto per divertimento, di applicativi più complessi: si realizzarono quindi dei software più sofisticati che avevano, al loro interno, dei dizionari per la lettura delle parole straniere, delle funzioni intelligenti per evidenziare oggetti e menu.
Si arrivò, quindi, in breve tempo ad avere dei software che, almeno con il sistema operativo DOS, potevano funzionare con moltissime applicazioni, avendo il sistema DOS un'interfaccia testuale abbastanza semplice per poter essere esplorata e tenuta sotto controllo da uno screen reader.

Poi, ci fu l'avvento di Windows e le cose cambiarono radicalmente. Essendo Windows un sistema grafico che lavorava soprattutto con oggetti riposizionabili e con eventi di vario genere che agiscono su questi ultimi, fu molto più complesso realizzare screen readers standardizzati che potessero essere usati su vari applicativi.
L'alternativa che venne trovata fu quella di realizzare una simulazione del mouse attraverso la tastiera: i primi software presentati in Italia furono Outsspoken e Virgo. Ovviamente, pur avendo un mouse che poteva essere pilotato da tastiera, era molto difficile per utenti con una conoscenza media del PC, conformarsi a questa nuova modalità d'uso. Peraltro, non era possibile utilizzare al meglio tutti gli applicativi presenti sul mercato, poiché in molti casi gli oggetti sui quali si posizionava il mouse erano delle immagini che non avevano del testo che potesse essere letto dal sintetizzatore.
Intervenne, in aiuto, la tecnologia dei dizionari: questa volta oltre alle parole da pronunciare correttamente, vennero inseriti anche dei nomi per i simboli più comuni.

Ci fu anche un'importante rivoluzione per quanto riguarda i sintetizzatori vocali: furono realizzati dei programmi che simulavano, attraverso l'aiuto della scheda audio del PC, la sintesi della voce: questi programmi, basati sulla tecnologia delle basi di dati, prendono un testo in input, prendono dei campioni sonori opportunamente inseriti in un database, li mettono in sequenza fra di loro e costruiscono un file audio da far riprodurre alla scheda sonora; questo file audio non è altro che la parola o la frase che verrà pronunciata; questa tecnologia viene chiamata text-to-speech.

Il più noto screen reader di nuova generazione è Jaws, che utilizza un linguaggio di programmazione in grado di ambientare delle applicazioni, che non richiedono l'uso della tastiera, per mezzo di funzioni che determinano la posizione del cursore e del puntatore del mouse ed, inoltre, l'attivazione di eventi, quali il cambiamento del focus di un oggetto o lo scorrimento di uno slider.

Oggi come oggi, sono presenti sul mercato, ed anche in forma gratuita, dei Text-to-speech che permettono di realizzare applicativi, totalmente indipendenti da uno screen reader, e quindi senza richiedere che l'utente finale abbia la versione più aggiornata dello screen reader: ne è un esempio il Microsoft Reader, il cui Text-to-speech è però ancora soltanto in lingua inglese.
Anche per il sistema Linux, sistema open source, sono stati realizzati dei software, come ad esempio il Brltty, che si avvale del supporto dei display braille.
Purtroppo, per quanto riguarda gli screen reader siamo ancora molto lontani, sebbene siano stati realizzati software come Emacsspeech, che non permette l'utilizzo di più terminali, poiché attiva una shell che si sovrappone a quella caricata dopo aver effettuato il login.

Conclusioni

Nonostante la tecnologia degli screen readers sia ormai ben affermata sul mercato, c'è ancora molto da lavorare per rendere gli applicativi accessibili a tutti e, cosa più importante, non si può pensare che, in un futuro ci sarà uno screen reader in grado di avere accesso a tutte le applicazioni presenti, in forma commerciale, shareware o freeware; occorrerà sempre lavorare al fine di rendere accessibili queste applicazioni; forse, bisognerebbe cominciare a pensare di creare, per ogni applicativo i plugins che lo rendano accessibile al text-to-speech.

I costi di questi software, sono molto alti, quindi non sempre c'è la possibilità da parte di tutti di acquistare la versione aggiornata del software; questo comporta che si possa rimanere indietro, rispetto alla tecnologia grafica che sta avanzando sempre più velocemente: sarebbe impossibile per chiunque, affrontare delle spese periodiche per acquistare la versione aggiornata del software, quindi la gente comune preferisce affrontare la spesa una tantum: forse occorrerà cercare un'alternativa per risolvere questo problema che soddisfi le esigenze dei molti, anziché le risorse di pochi.

21/10/2002