lunedì 19 luglio 2021
Il riconoscimento automatico della scrittura a mano, in inglese Handwriting recognition, anche noto come Handwritten text recognition (Htr), si riferisce alla capacità di un software di interpretare la scrittura a mano; essa può essere acquisita in diverse modalità: da documenti cartacei o da immagini digitali, piuttosto che da fotografie o dispositivi touch screen e scanner.
Tale attività, che per un essere umano è immediata in quanto codificata all’interno del nostro cervello, è estremamente complicata per un software a causa dell’enorme variabilità della scrittura a mano a seconda dello scrivente, dell’alfabeto e della lingua di riferimento. Inoltre, tale attività soffre del cosiddetto paradosso di Sayre, secondo cui una parola corsiva, per essere trascritta, deve essere prima segmentata in caratteri ma viceversa, per essere segmentata in caratteri, deve essere prima trascritta.
In particolare, si può distinguere l’offline Htr, in cui il testo da riconoscere è disponibile in formato immagine e che rappresenta il processo di conversione del testo presente in un’immagine in una sequenza di lettere codificate che possono essere utilizzate da un computer (in un formato chiamato machine-readable) e l’on-line Htr, in cui il testo da riconoscere viene acquisito da un dispositivo tipo tablet in tempo reale, e che ha lo stesso obiettivo finale dell’offline Htr ma consente l’utilizzo di ulteriori informazioni disponibili come la velocità di scrittura, la pressione e la dinamica e che quindi fornisce risultati migliori.
I primi software per computer che affrontavano il problema del riconoscimento della scrittura a mano sono stati realizzati all’inizio degli anni ’60 (Sheila Guberman nel 1962) ma erano in grado di leggere solamente i caratteri a mano isolati e non la scrittura corsiva; solamente alla fine degli anni ’80 si sono realizzati software capaci di leggere anche il corsivo e sono usciti i primi software commerciali.
Ad oggi tecniche basate su reti neurali, opportunamente rielaborate grazie al paradigma del deep learning o apprendimento profondo, oppure tecnologie brevettate da aziende italiane, basate su approcci completamente innovativi, consentono di ottenere prestazioni molto elevate, soprattutto se utilizzate in contesti specifici, anche se esse sono ancora lontane dall’essere comparabili con quelle che ottiene un essere umano.
Utilizzo in Sanità
Le applicazioni in ambito sanitario di tale tecnologia possono essere diverse, con vantaggi sia dalla parte dei medici che devono prendere decisioni, che per i pazienti, i quali potrebbero avere tutti i dati relativi alla loro situazione in un unico file digitale: la cartella clinica digitale. Infatti, la principale applicazione nel settore sanitario riguarda la conversione delle note e degli appunti presi dai medici durante le varie fasi delle proprie attività su carta o su dispositivi di acquisizione come tablet o smartphone in testo che sia machine readable, e quindi immediatamente disponibile per i sistemi informativi sanitari.
Il vantaggio principale dell’applicazione di tale tecnologia è quello di utilizzare e di dare un significato a dei dati che altrimenti potrebbero essere ignorati o non contestualizzati e che pertanto difficilmente potrebbero rappresentare un valore aggiunto. Inoltre, il processo di acquisizione e di utilizzo di tali dati scritti a mano, che ad oggi è quasi totalmente analogico poiché un operatore umano manualmente trasferisce tali dati nel sistema informativo, operazione che richiede ore se non giorni, diventerebbe estremamente più efficace ed efficiente e richiederebbe il 60-70 per cento in meno del tempo necessario oggi per completare l’operazione.
Tale tecnologia in Italia è stata applicata con successo anche in altri settori, come quello assicurativo, postale e bancario, per la gestione di grandi volumi di documenti manoscritti relativi a richieste di rimborsi, gestione sinistri, lettura automatica assegni e indirizzi postali oppure formulari con una struttura predefinita. Una tecnologia innovativa ed utile ai nostri professionisti della Sanità.
(*) Consulente in Editoria medico-scientifica e Sanità digitale, Socio e segretario dell’Osservatorio sanità digitale dell’Associazione Italian Digital Revolution (Aidr)
di Giancarlo De Leo (*)