Skip to content

Funcționalitățile inteligente ale lui Apollo: Splitter-ul.

Spliter-ul este primul modul din lanțul de procesare inteligentă. El identifică automat dacă în fișierul încărcat în platforma IDP Apollo se află unul sau mai multe documente separate, cu ajutorul tehnologiei  Computer Vision.

 

Dacă splitter-ul a identificat mai multe documente, acestea vor fi separate în fișiere distincte, fiecare conținând un singur document.

 

Pentru a pregăti și antrena un splitter personalizat, identifică în istoricul fișierelor cu documente  primite de-a lungul timpului acele  fișiere care conțin mai multe documente și încarcă-le in splitter pentru antrenarea sistemului. 

Toate fisierele incarcate pentru învățare și antrenare formează dataset-ul pentru splitter. Pentru o performanță mai bună a splitter-ului în urma învățării, îți recomandăm să folosești cel puțin 100 de pagini care reprezintă prima pagină a unui document și cel puțin 100 de pagini care NU reprezintă prima pagină a unui document, adică să fie pagina 2,3 sau așa mai departe.

E important ca dataset-ul să fie unul echilibrat, adică numărul exemplelor de prima pagină să fie aproximativ egal cu numărul exemplelor de pagina 2,3 etc.

 

Iată care sunt pașii pe care îi ai de urmat:

1. În meniul din stânga, mergi în Documents Flow și activează modulul de splitter din meniul central de configurare.

2. Dă click pe Splitter, apoi pe Add new splitter și introdu numele splitter-ului pe care vrei să îl creezi.

3. Dă click pe numele splitter-ului, apoi încărca documentele pentru învățare. Nu uita de recomandările de mai devreme în ceea ce privește dataset-ul necesar antrenării.

4. După ce toate exemplele pentru învățare au fost încărcate în splitter, marchează fiecare pagină în parte ca fiind First Page sau NOT First Page.

5. După ce ai marcat paginile cu atributele corespunzătoare, dă click pe Auto-tags. Acum poți porni învățarea, proces care durează aproximativ 4-5 ore.

 

Când a terminat de învățat, Splitter-ul va trece singur în starea Ready, fiind însă Inactive. Pentru a-l folosi, dă click pe Edit, apoi Activate. Îl poți testa pe câteva documente din rubrica My Documents și vei observa cum sunt automat analizate și separate în fișiere distincte, fiecare conținând un singur document.

 

Foarte important de reținut este că nu poți avea mai mult de un splitter activ! Dacă activezi un splitter în timp ce altul era deja activ, Apollo îl va dezactiva pe primul și îl va activa pe cel mai nou.  

 

Spor la treabă! De Procesarea Inteligentă a Documentelor se ocupă Apollo! 😊