Home


Cateva recomandari utile la scanare



Cateva recomandari din experienta celor care au scanat cartile din Biblioteca, pt cei care doresc sa contribuie cu carti scanate pe viitor:

Rezolutie: folositi 100 sau 150 dpi (depinde de cat de mare/groasa e litera si de eventualele desene).
De exemplu, pentru Laborator s-a folosit 100dpi.

Aliniere: Ar fi ideal sa aliniati paginile cat mai exact pe scaner (trebuie facute cateva teste la inceput de preferat pe o pagina care are contine o linie). Apoi trebuie tinut minte (eventual marcat cu creionul discret pe marginea scanerului) pozitia coltului copertei. Dar desigur ca fiecare pagina va fi usor nealiniata, ceea ce nu e o problema (rotirea imagini nu cred ca e o solutie, fiindca o poate deforma daca softul nu e bun).

Optiuni de scanare: depinde de scaner si softul folosit, dar in general in afara de balanta brightness si contrast (care sunt bine de lasat cele din default - probabil 50%) ar trebui sa existe 3 optiuni de scanare: alb/negru (black & white, b/w), nuante de gri (256 de preferat sau 65.000 de nuante de gri) si color. Stabilirea acestei optiuni are cel mai mare impact in marimea imaginii (alaturi de rezolutie). Ridicarea usoara a contrastului poate ajuta in cazul in care apar detalii (murdarie) in pagina altele decat litera.

Salvare imagine: depinde de soft, veti avea de ales in general cel putin intre popularele gif, jpg (eventual cu reglarea factorului de compresie), bmp si tiff (ultimele doua in general foarte mari). Pentru acces online, se recomanda gif sau jpg (cu factor de compresie mai mare - minimum 10).

Cea mai buna alegere: in general pt carti (format obisnuit, fara culori) dupa testele mele este 100 dpi, black & white, salvat gif. Cu astea, fiecare imagine (un format ca Laboratorul) ar trebui sa iasa cam la 30-40Kb deci foarte mica. Daca cartea este mai veche/tiparita prost, sau are literele mai mici, trebuie incercat fie 150dpi (in loc de 100dpi), fie nuante de gri (in loc de alb/negru), lucru care va face insa imaginile sa devina mai mari (100-200Kb) iar salvarea tot in gif (sau alternativ in cazul nuante de gride incercat si jpg). Daca cartea contine multe desene care trebuiesc reproduse folosind nuante, atunci cel putin acele pagini trebuie scanate in 256 nuante de gri (ceea ce va mari insa fisierele).
De exemplu, Laboratorul (250 de pag), care a fost scanat doua pagini de carte per imagine (deci 125 de pag in format pdf) are doar 8Mb si se poate trage la imprimanta si citi fara probleme.

Fisiere pdf: Probabil cel mai popular format de fisier este pdf (citibil cu Adobe Reader Acrobat sub Windows, xpdf sau adobe sub Linux, etc). Dupa ce au fost obtinute fisierele imagini (de preferat cate o imagine per doua pagini de carte), este recomandat sa se creeze cate un fisier pdf per fiecare capitol de carte (care ocupa in general sub 1-2 Mb, fiind deci usor transferabil pe web, asa incat o carte sa aiba in jur de 10 Mb in total). Importul imaginilor si salvarea in fisiere pdf se poate face de exemplu in Corel Draw sau Adobe Acrobat Distiller ("full version") in care paginile trebuie orientate landscape.

Volum de munca: Cca 5 ore per carte (250 pag), dupa cum urmeaza: scanare cca 3 ore (inclusiv o ora pentru testarea optiunilor optime - foarte important in special pt prima carte scanata!), importul imaginilor si salvarea in format pdf cca 2 ore.

OCR (Caracter Recognition): Desigur ca calitatea fisierelor pdf finale ar fi mult mai buna (iar marimea mult mai mica) daca dupa scanare imaginile ar fi transformate in caractere, folosind un soft de recunoastere de caractere. Aceasta treaba necesita insa mult mai mult timp decat formula simplificata de mai sus, deoarece in afara de erorile inerente ale softului, caracterele romanesti, mai apare si problema figurilor, a tabelelor, etc.

Alternative: la varianta pdf, in cazul in care imaginile initiale sunt in 256 nuante de gri sau color, se poate pune online careta in imagini, citibila cu un script deja existent. In acest caz, fiecare pagina trebuie salvata sub numele "Pagina###.jpg" unde ### reprezinta numarul (de ex Pagina032.jpg) totdeauna cu ### un numar cu sotz (care sa corespunda cu cel al paginii din stanga din carte).

In cazul in care doriti sa ne scrieti,
pentru sesizari, recomandari, sau
critici, o puteti face AICI

PRACTICA | TEORETICA | REVISTE | TEZE | ISTORIE | ALTELE
Copyright © Astro Librarian 2014. Designed by Saiph