Normalize

Normalize è un vero e proprio sistema che racchiude tutte le funzioni di dialogo in ingresso e in uscita dalla piattaforma ECS 2.0, attraverso un'avanzata gestione multi-canale, multi-formato di documenti. In particolare, il sistema di acquisizione si articola in tre fasi principali:

  • prelevamento del documento dal canale di ingresso configurato
  • estrazione dei dati significativi e trasformazione in un formato intermedio comune (normalizzazione)
  • inserimento delle informazioni normalizzate nella coda di elaborazione di ECS 2.0

Se l’acquisizione di documenti cartacei da parte di ECS 2.0 è la scansione, l’obiettivo di Normalize è la gestione dell’acquisizione di tutti i documenti non scansionabili, attraverso uno Hub unico multicanale. Fanno parte dei possibili input di Normalize i documenti in formato elettronico strutturato (es. EDI o XML), per i quali un tracciato o schema definisce con esattezza la natura e la posizione delle informazioni, e i PDF/TIFF. Per i tracciati strutturati Normalize genera anche una rappresentazione grafica del documento (in PDF) per permettere agli utilizzatori di visionarlo senza conoscerne il formato originale.
 

 

A seconda dei formati e della configurazione, i documenti in ingresso seguono strade differenti:
  • file stutturati (EDI): vengono convertiti in un formato intermedio (XML-N) prima di essere inseriti in coda di lavoro.
  • file PDF: vengono sottoposti al processo di riconoscimento (OCR/ODR) prima di essere inseriti in coda di lavoro.
  • file PDF contenenti metadati in formato eInvoice (noto anche come freeform): possono (dipendendo dalla configurazione) seguire il percorso sopra descritto oppure essere convertiti in XML-N sfruttando i dati già presenti nei metadati, considerandoli quindi alla stregua di file strutturati.
Il processo di normalizzazione dei file strutturati inizia con l’acquisizione del documento da uno dei canali supportati e configurati. Il file viene analizzato sulla base dello schema predefinito (parsing). Successivamente avviene la normalizzazione vera e propria, in cui le informazioni sono estratte dalla struttura di input e inserite nei rispettivi campi del formato intermedio. In tutte le fasi della normalizzazione, al verificarsi di un errore il file in ingresso viene parcheggiato in un'area specifica, dalla quale può essere analizzato ed eventualmente re-inserito nel flusso. Normalize interfaccia più canali di ingresso, tra i quali i più utilizzati sono e-mail e disco fisso. Si tratta di canali di tipo pull, ossia Normalize si occupa di interrogarli periodicamente. Per ciascun canale è possibile definire il sub-canale, ossia una specializzazione del canale che è univocamente identificabile e associabile a un’Azienda (ed eventualmente a un tipo documento). 

 


Canale e-mail
Normalize dispone di un un sofisticato sistema di "detaching" focalizzato sulla gestione del canale e-mail. Possono essere configurate tutte le caselle di posta necessarie, gestirne l'eventuale accreditamento del fornitore, parametrizzarne le regole di lettura e instradamento. In particolare il sistema gestisce ogni tipo di messaggio, anche in formati zippati, ne indaga la tipologia di documento scartando quelli non rispondenti alle specifiche del documento che si sta gestendo (ad esempio fattura, bolla, nota di credito, ecc.). Normalize analizza, con frequenza configurabile, una serie di caselle di posta. Ogni casella può essere interrogata via IMAP o POP3 (e rispettive versioni sicure su SSL POP3s e IMAPs). Ogni casella può essere associata a una differente Azienda presente in ECS. I documenti letti dalla casella sono direttamente assegnati all’azienda associata. E’ possibile definire più caselle di posta per una stessa azienda. Ciascuna di queste caselle può (non è obbligatorio) essere associata anche a un determinato tipo documento. I documenti sono ricavati dall’esame degli allegati ai messaggi di posta elettronica scaricati dal server. Gli allegati possono essere in qualunque numero (fino alla dimensione massima del messaggio consentita dal server di posta). E’ permesso inglobare diversi documenti in un unico file compresso (.zip) e allegare soltanto quest’ultimo al messaggio. I messaggi scartati (per mancanza di allegati, per errori o altre ragioni) vengono parcheggiati con uno stato che ne identifica la ragione del parcheggio. Normalize Monitor può essere utilizzato per verificarne la presenza, gli errori occorsi ed eventualmente provare la rielaborazione. I messaggi letti vengono cancellati dalla casella di posta, per evitare acquisizioni multiple.

Canale disco
Normalize analizza, con frequenza configurabile, una serie di cartelle su disco fisso. Ogni cartella può essere associata a una differente azienda, purché configurata in ECS 2.0, e a un determinato tipo documento. I documenti letti dalla cartella sono direttamente assegnati all’azienda associata (salvo differente configurazione). A partire dalla versione 2.7, è possibile definire più cartelle per una stessa azienda. Ciascuna di queste cartelle può (non è obbligatorio) essere associata anche a un certo tipo documento. Normalizer riconosce i file compressi (.zip) ed è in grado di decomprimerli e analizzare i documenti all’interno. I documenti scartati (per errori o altre ragioni) vengono parcheggiati in un’area disco differente (configurabile), e segnalati nel Normalize Monitor. I documenti letti da disco vengono poi cancellati, per evitare acquisizioni multiple.

Canale EDI: formati standard
I formati standard attualmente supportati da Normalize sono:

  • EDIFACT D96A, D97B
  • SAP-IDOC TEXT, XML
  • XML-CBI v4
  • XCBL
  • EURITMO
  • DAFNE
  • PDF generico
  • TIFF
  • PDF con XML eInvoice embedded (metadato)
  • PDF con file strutturato embedded (metadato)
     

Canale EDI: formati custom
Un potente strumento grafico permette di definire in modo intuitivo la composizione di qualsiasi file che deve essere gestito. In questo modo è possibile mantenere i formati già in uso in azienda adattando Normalize al nuovo formato. Normalize supporta anche combinazioni custom di formati validi singolarmente. Un esempio è il caso Dafne.