Digitalização de livros

Um digitalizador de livros - Internet Archive

A Digitalização de livros é um processo pelo qual se capturam as imagens das página de um livro em papel, com recurso a um digitalizador que as convertem em formatos digitais. É uma técnica habitualmente utilizada por bibliotecas digitais, como o Google Book Search, o Projeto Gutenberg, o Distributed Proofreaders, ou a Biblioteca Nacional Digital.

Geralmente, após a digitalização das páginas, estas são submetidas a um reconhecimento óptico de caracteres (OCR) através do qual se geram documentos de texto (em formato TXT, RTF, PDF, ou outros) para facilitar a busca de conteúdos e a leitura em computadores e PDA.

O processo de digitalização pode ser manual, automático (ou robotizado) ou parcialmente automático. Um protótipo de um scanner-robô, pesquisado pela empresa austríaca Treventus venceu na Cebit 2007, o Grande Prêmio" do European Information and Communication Technology Award.[1].

Existem grupos especializados de digitalização de livros, tanto empresarias, quanto amadores que se dedicam a construção de seus próprios digitalizadores de livros artesanais.[2]

Digitalização destrutiva

Neste tipo de digitalização, a lombada do livro é cortada fora, transformando o livro numa pilha de papéis que é rapidamente digitalizada por um digitalizador comum, com ganhos de qualidade e rapidez em relação ao processo com um livro inteiro.

Digitalização não destrutiva

Um exemplo de um digitalizador de livros artesanal, onde a força da gravidade ajuda a achatar as páginas do livro.

Este tipo de digitalização evita a destruição do livro, com digitalizadores específicos para livros que evitam áreas escuras e minimizam os riscos de o livro ser danificado ou a imagem digitalizada ficar distorcida.[3] Estes tipos de digitalizadores também procuram estender a área útil do digitalizador o mais próximo possível da borda, para assim permitir que o livro possa ficar com um dos lados suspensos, enquanto a página de interesse é digitalizada.

Pesquisadores da Universidade de Tóquio criaram um digitalizador de livros experimental [4] que inclui um digitalizador de superfície tridimensional e que possibilita que imagens de uma superfície curva sejam planificadas através de software, possibilitando digitalizar imagens tão rápidas quanto o operador possa virar as páginas do livro - por volta de 200 páginas por minuto.

Equipamentos para a digitalização de livros

No mercado diversos modelos competem pelo melhor desempenho no que se refere à digitalização de documentos e livros. A agilidade, design e principalmente a facilidade do uso do aparelho são fatores que determinam a escolha desse ou daquele equipamento. Na digitalização de livros em especial, destacam-se no mercado os produtos da marca Joyusing. Esses dispositivos utilizam recursos ópticos poderosos e resoluções de imagem que garantem um arquivo de boa qualidade e altamente legível. Além disso, contam com o recurso de OCR que permite o reconhecimento de caracteres, o que transforma as páginas dos livros digitalizados em páginas com conteúdo pesquisável.

Referências

  1. Conrad Gruber: Nie mehr Umblättern – Treventus: Erfolgsstory mit Scanroboter. Em: MONITOR online. Junho 2006. (em alemão)
  2. «Página do DIY Book Scanner (Faça Você Mesmo seu Digitalizador de Livros)» (em inglês)  A referência emprega parâmetros obsoletos |língua2= (ajuda)
  3. «Vectorscan, manual de digitalização de livros.» (PDF) 
  4. «"Superfast Scanner Lets You Digitize Book By Flipping Pages", IEEE Spectrum, March 17, 2010» (em inglês)  A referência emprega parâmetros obsoletos |língua2= (ajuda)

Ver também

  • Livro digital
Ícone de esboço Este artigo sobre informática é um esboço. Você pode ajudar a Wikipédia expandindo-o.
  • v
  • d
  • e