
Una delle caratteristiche principali di LogicalDOC è l' indicizzazione full-text di tutti i documenti per fornire risultati di ricerca istantanea basati sul contenuto di file e metadati.
Sfruttando le migliori tecnologie LogicalDOC indicizza automaticamente il contenuto completo dei documenti nel repositorio. Per massimizzare le prestazioni e aumentare la possibilità di esecuzioni contemporanee, la procedura di indicizzazione è asincrona con una politica di programmazione configurabile.
Il motore di ricerca è altamente configurabile, ed è possibile definire il conteggio degli elementi, la repository che memorizza l'indice e l'ordine utilizzato per elaborare i documenti. Inoltre è possibile applicare filtri di Inclusione/Esclusione per limitare il numero dei documenti da processare (applicandoli anche soltanto ai metadati), definire dimensioni e limiti dei fili analizzati e stabilire Batch e timeout del parsing (per determinare il numero di documenti processati e il tempo massimo per processare un singolo documento).
Il testo estratto passa attraverso una serie di filtri configurabili, che lo trasformano in una forma standardizzata adatta all'indicizzazione. Nella scheda Filtri si visualizzano tutti i filtri disponibili Stemmer, Worddelimiter e Ngram, che a loro volto possono essere ulteriormente configurati nei propri parametri specifici.
Il pannello di controllo mette a disposizione numerose lingue che è possibile abilitare o disabilitare con facilità. Diversi algoritmi vengono applicati a seconda della lingua del documento, in modo che la ricerca sia su misura e in grado di rilevare varianti della parola specifica per la lingua specificata.
Diversi algoritmi vengono applicati a seconda della lingua del documento in modo che la ricerca sarà su misura e in grado di rilevare varianti della parola specifica per una data lingua.
Quando un utente effettua una ricerca, il motore di ricerca consulta l'indice per trovare corrispondenze pertinenti e restituisce i risultati in base ai criteri specificati.
Questo processo garantisce che i documenti siano rapidamente ricercabili e che il contenuto sia indicizzato in modo efficiente, permettendo agli utenti di trovare informazioni precise e pertinenti all'interno dei loro archivi documentali.
Benefici di questa caratteristica
- Si riduce drasticamente la necessità di inserimento dei dati in quanto l'intero contenuto di un documento viene indicizzato automaticamente e questo basta per trovare le informazioni desiderate.
- Gli utenti sono in grado di trovare le informazioni richieste in una manciata di secondi
Dettagli della caratteristica
- Indicizzazione asincrona con politiche sheduling
- Algoritmi di indicizzazione specifici per ogni lingua
- Supporto per i maggiori formati di ufficio (Microsoft Office, Open Office, PDF e molti altri)
- OCR integrato per estrarre i testi dalle immagini e dai PDF raster
- Maggiori informazioni nella Guida dell'Utente
- Settaggi ed impostazioni nella Guida dell'Amministratore
- Guarda il video