Il tratto di Amazon Tex porta l'intelligenza all'OCR

Mercoledì, 28 Novembre 2018

2698 Visite

Una delle sfide che riguardano tutti i volti aziendali è la conversione di forme in un utile formato digitale. Questo in genere ha comportato l'utilizzo di impiegati di inserimento dati umani per inserire i dati nel computer. Lo stato dell'arte prevedeva l'uso dell'OCR per la lettura automatica dei moduli, ma il CEO di AWS Andy Jassy ha spiegato che l'OCR è fondamentalmente solo un lettore di testo stupido. Non riconosce i tipi di testo. Amazon ha voluto cambiarlo e oggi ha annunciato Amazon Textract, uno strumento OCR intelligente per trasferire i dati dai moduli a un formato digitale più utilizzabile.

In un esempio, ha mostrato un modulo con le tabelle. L'OCR regolare non riconosceva la tabella e la interpretava come una stringa di testo. Textract è progettato per riconoscere elementi di pagina comuni come una tabella e tirare i dati in modo sensato.

Jassy ha detto che anche le forme cambiano spesso, e se si utilizza un modello come soluzione per la mancanza di intelligenza di OCR, il modello si rompe se si sposta qualcosa. Per risolvere il problema, Textract è abbastanza intelligente da comprendere tipi di dati comuni come numeri di previdenza sociale, date di nascita e indirizzi e li interpreta correttamente, indipendentemente da dove cadono sulla pagina.

"Abbiamo insegnato a Textract a riconoscere che questa serie di personaggi è una data di nascita e questo è un numero di previdenza sociale. Se le forme cambiano, Textract non mancherà ", ha spiegato Jassy.

Rimani aggiornato seguici su Telegram

Facebook Twitter LinkedIn Xing VK Pinterest Reddit Pocket

Come ti senti con questo post?

Tag:

Informazioni sull'autore

Druskus

(411 Punti)

Risultati

Proprietario del sito Impero Web e Community Builder Italia, professionista IT Manager esperto in tecnologia avanzata, curioso del mondo opensource, personaggio di spicco nel mondo joomla sviluppatore di file di lingua italiana per note estensioni di social networking e forum, nel 2011 e 2012 grazie alle sue attività e passione che svolge nel mondo opensource viene pubblicato su due libri uno della casa editrice Hoeply chiamato "Fare Business di Joomla" scritto dal Prof. Roberto Chimenti e l'altro in formato Kindle chiamato "Costruisci un sito social network con Joomla! e Community Builder" grazie a queste pubblicazioni ed anche per la sua preparazione viene definito come un valido punto di riferimento italiano ed uno dei massimi esperti in materia. Appassionato della cultura nipponica Anime e Manga che segue con dedizione, portandolo a recensire con passione e cerca di carpire le nuove tecnologie utilizzate per la realizzazione delle opere.