Digitalização de livros

A Digitalização de livros é um processo pelo qual se capturam as imagens das página de um livro em papel, com recurso a um digitalizador que as convertem em formatos digitais. É uma técnica habitualmente utilizada por bibliotecas digitais, como o Google Book Search, o Projeto Gutenberg, o Distributed Proofreaders, ou a Biblioteca Nacional Digital.

Um digitalizador de livros - Internet Archive

Geralmente, após a digitalização das páginas, estas são submetidas a um reconhecimento óptico de caracteres (OCR) através do qual se geram documentos de texto (em formato TXT, RTF, PDF, ou outros) para facilitar a busca de conteúdos e a leitura em computadores e PDA.

O processo de digitalização pode ser manual, automático (ou robotizado) ou parcialmente automático. Um protótipo de um scanner-robô, pesquisado pela empresa austríaca Treventus venceu na Cebit 2007, o Grande Prêmio" do European Information and Communication Technology Award.[1].

Existem grupos especializados de digitalização de livros, tanto empresarias, quanto amadores que se dedicam a construção de seus próprios digitalizadores de livros artesanais.[2]

Digitalização destrutiva

editar

Neste tipo de digitalização, a lombada do livro é cortada fora, transformando o livro numa pilha de papéis que é rapidamente digitalizada por um digitalizador comum, com ganhos de qualidade e rapidez em relação ao processo com um livro inteiro.

Digitalização não destrutiva

editar
 
Um exemplo de um digitalizador de livros artesanal, onde a força da gravidade ajuda a achatar as páginas do livro.

Este tipo de digitalização evita a destruição do livro, com digitalizadores específicos para livros que evitam áreas escuras e minimizam os riscos de o livro ser danificado ou a imagem digitalizada ficar distorcida.[3] Estes tipos de digitalizadores também procuram estender a área útil do digitalizador o mais próximo possível da borda, para assim permitir que o livro possa ficar com um dos lados suspensos, enquanto a página de interesse é digitalizada.

O primeiro scanner de livros totalmente automatizado foi o DL (Digitizing Line), fabricado pela empresa suíça 4DigitalBooks. Sua primeira instalação conhecida ocorreu na Universidade de Stanford em 2001.[4][5] O scanner recebeu o prêmio Dow Jones Runner-Up na categoria Aplicações Empresariais em 2001.[6]

Em 2007, a empresa TREVENTUS apresentou um digitalizador automático com um ângulo de abertura de 60° para digitalização, aprimorando a conservação dos livros durante o processo. Esse projeto foi premiado com o ICT Grand Prize 2007 da União Europeia.[7][8] A tecnologia foi utilizada em um projeto de digitalização em massa da Biblioteca Estatal da Baviera, no qual 8.900 livros do século XVI foram digitalizados em 18 meses com o uso de três scanners do tipo "V-shape".[9]

A maioria dos scanners robóticos comerciais utiliza tecnologia de fluxo de ar e sucção para virar páginas, enquanto alguns modelos mais avançados incorporam dedos biônicos para essa função. Sensores ultrassônicos ou fotoelétricos são empregados para detectar páginas duplas e evitar a omissão de conteúdo.[10][11] Alguns dos modelos mais sofisticados são capazes de digitalizar até 2.900 páginas por hora, sendo projetados especialmente para projetos de digitalização em larga escala.[12]

Pesquisadores da Universidade de Tóquio criaram um digitalizador de livros experimental [13] que inclui um digitalizador de superfície tridimensional e que possibilita que imagens de uma superfície curva sejam planificadas através de software, possibilitando digitalizar imagens tão rápidas quanto o operador possa virar as páginas do livro - por volta de 200 páginas por minuto.

Equipamentos para a digitalização de livros

editar

No mercado diversos modelos competem pelo melhor desempenho no que se refere à digitalização de documentos e livros. A agilidade, design e principalmente a facilidade do uso do aparelho são fatores que determinam a escolha desse ou daquele equipamento. Na digitalização de livros em especial, destacam-se no mercado os produtos da marca Joyusing. Esses dispositivos utilizam recursos ópticos poderosos e resoluções de imagem que garantem um arquivo de boa qualidade e altamente legível. Além disso, contam com o recurso de OCR que permite o reconhecimento de caracteres, o que transforma as páginas dos livros digitalizados em páginas com conteúdo pesquisável.

Referências

  1. Conrad Gruber: Nie mehr Umblättern – Treventus: Erfolgsstory mit Scanroboter. Em: MONITOR online. Junho 2006. (em alemão)
  2. «Página do DIY Book Scanner (Faça Você Mesmo seu Digitalizador de Livros)» (em inglês) 
  3. «Vectorscan, manual de digitalização de livros.» (PDF) 
  4. «Stanford University Libraries' (SUL) Robotic Book Scanner». Stanford University Library. 7 de maio de 2003. Consultado em 17 de fevereiro de 2025. Arquivado do original em 8 de dezembro de 2014 
  5. «4DigitalBooks launches digital book scanner». PrintWeek. 29 de novembro de 2001. Consultado em 17 de fevereiro de 2025. Arquivado do original em 8 de dezembro de 2014 
  6. «Technology Innovation Awards: WINNERS 2001». dowjones.com. Consultado em 17 de fevereiro de 2025. Arquivado do original em 23 de setembro de 2015 
  7. «British, Swedish and Austrian entrepreneurs win the EU's "Nobel prize" for ICT». europa.eu. 16 de março de 2007. Consultado em 17 de fevereiro de 2025. Arquivado do original em 8 de julho de 2013 
  8. «Treventus ICT Grand Prize 2007». Treventus (em inglês). Consultado em 17 de fevereiro de 2025 
  9. «Bavarian State Library VD16 project»» (PDF). treventus.com. 1 de novembro de 2009. Arquivado do original (PDF) em 8 de julho de 2016 
  10. «6 Factors to Consider while Digitizing Books at Scale - Hurix Digital». hurix.com. 22 de julho de 2019. Consultado em 17 de fevereiro de 2025. Arquivado do original em 17 de janeiro de 2022 
  11. Harman, Mike (23 de março de 2021). «An 8-Step Guide to Digitization for Book Publishers». kitaboo.com. Consultado em 17 de fevereiro de 2025. Arquivado do original em 22 de janeiro de 2022 
  12. Rapp, David (18 de julho de 2011). «Product Watch». Library Scanners. Consultado em 17 de fevereiro de 2025. Arquivado do original em 29 de agosto de 2013 
  13. «"Superfast Scanner Lets You Digitize Book By Flipping Pages", IEEE Spectrum, March 17, 2010» (em inglês) 

Ver também

editar
  Este artigo sobre informática é um esboço. Você pode ajudar a Wikipédia expandindo-o.