Indexeren
Onder indexering verstaan we bij MicroFormat het toekennen van gegevens aan een document of een collectie van documenten, waardoor ze sneller terug gevonden kunnen worden. Hierbij kunt u denken aan een hoofdstukindeling, een trefwoordenregister, maar ook aan een namenregister voor de burgerlijke stand. MicroFormat heeft de modernste technieken in huis om gescande documenten te indexeren.
Hiervoor zijn -afhankelijk van de gewenste situatie of (eind-)gebruik- verschillende technieken en systemen mogelijk:
- Middels een Database/Concordantietabel;
Hierbij kunt u bijvoorbeeld denken aan het aanmaken van een database met daarin de naam, geboortedatum en geboorteplaats van bijvoorbeeld persoonskaarten. - Met behulp van voorloopvellen/barcodes;
Hierbij kunt u bijvoorbeeld denken aan het indelen van bijvoorbeeld bouwdossiers op bijvoorbeeld aanvraag, besluit en tekeningen. - Middels een indexbestand;
Hierbij kunt u bijvoorbeeld denken aan het indelen van boeken op hoofdstukniveau, waarbij de inhoudsgave wordt gekoppeld aan de desbetreffende pagina. - Met behulp van tekstherkenning OCR.
Hierbij kunt u bijvoorbeeld denken aan het full-text doorzoekbaar maken van al uw gedrukt materiaal. Bij het gebruik van Optical Character Recognition, kortweg OCR, wordt een tekstbestand gemaakt op basis van uw digitale beelden. De output kan bijvoorbeeld worden verwerkt in een searchable (multi-page) pdf of als OCR XML. Ook het maken van ALTO-bestanden kan door MicroFormat worden uitgevoerd.