Digitalização de livros

De TradWiki 2.0

A tradução de livros passa igualmente por todas as etapas descritas em O projeto de tradução. A fase de preparação pode ter diferentes características, dependendo da maneira como o tradutor recebe o original a ser traduzido e de seus hábitos de trabalho.

Os tradutores mais tradicionais podem preferir simplesmente trabalhar diretamente com o livro impresso. Deixá-lo aberto diante de si, em cima da mesa ou sobre um suporte, e ir lendo o texto e traduzindo no computador. Mas também é possível preparar o texto para ser traduzido com o uso de ferramentas de memória de tradução e, para isso, é necessário que o livro esteja em formato digital e que o texto possa ser editado diretamente.

Livro impresso[editar | editar código-fonte]

Nem todas as editoras enviam os livros em formato digital. É comum o tradutor receber o original encadernado ou então, fotocopiado. Para passar o livro do papel para o computador, é preciso digitalizá-lo, ou seja, usar um scanner e um programa de OCR (optical character recognition) para converter o texto em um formato que possa ser editado no Word ou em qualquer outro processador de texto ou ferramenta de memória de tradução.

Para isso, é preciso ter um scanner de mesa, grande o suficiente para aceitar um livro aberto sobre o vidro, e um programa que faça a leitura do texto impresso e o converta para o formato editável. No momento, o programa mais conhecido para esse trabalho é o Abbyy Fine Reader, mas existem outros disponíveis no mercado.

O processo é relativamente demorado, uma vez que os scanners domésticos são relativamente lentos e o processo de conversão para o programa de OCR também. É necessário virar página a página, manter o livro aberto pressionado sobre o vidro do scanner, esperar a leitura e a abertura das páginas pelo programa de OCR e só depois fazer a conversão usando o programa de OCR, que precisará de algumas configurações específicas para gerar o texto final.

Scanners com alimentador automático de documentos — Uma boa alternativa para esse processo é usar um scanner com alimentador automático de documentos, mas, para isso, o livro precisa estar fotocopiado em papel tamanho A4 (ou qualquer outro tamanho que caiba no scanner). Esses scanners têm um dispositivo que permite colocar uma pequena resma numa bandeja de alimentação e as páginas vão sendo lidas automaticamente, sem a nossa intervenção. Ganha-se MUITO tempo com esse processo. Mesmo que o tradutor receba o livro encadernado, pode valer a pena fotocopiá-lo para usar um scanner com alimentação automática. Esses equipamentos não são caros e é comum em multifuncionais com impressora e scanner. Atualmente, julho de 2014, uma multifuncional a jato de tinta está na faixa de R$ 300,00, e uma laser, na faixa dos R$ 800,00.

Os resultados da digitalização pelo scanner não são perfeitos, é comum que algumas palavras e sinais gráficos saiam truncados e precisem de uma revisão pelo tradutor.

Livro em PDF[editar | editar código-fonte]

Algumas editoras enviam os livros em formato PDF, o que já é um avanço em relação ao livro impresso. No entanto, o PDF não é um formato que possibilite trabalhar diretamente sobre o texto, assim como o livro impresso, é preciso convertê-lo para que possa se tornar editável.

Existem diversos programas que fazem a conversão de PDF para texto editável. Os programas de OCR, como o Abbyy, mencionado acima, são bastante eficientes para esse processo, mas existem outros mais simples e baratos, alguns desenvolvidos especificamente para essa função. O procedimento é semelhante à conversão do livro digitalizado pelo scanner, só que, em vez de abrir um livro digitalizado, o programa abrirá o próprio PDF e fará a leitura e conversão do texto. Isso vale para qualquer documento em formato PDF.

Livros eletrônicos[editar | editar código-fonte]

Uma outra alternativa é a conversão dos livros eletrônicos. Quando se traduz livros recentes, são grandes as chances de eles estarem disponíveis para compra na Amazon, para leitura na plataforma Kindle, ou em outras livrarias, para Kobo ou qualquer outro e-reader. O problema nesse caso é que os livros eletrônicos costumam ser protegidos por DRM). Existe uma discussão se é legal ou não quebrar essa proteção, mais neste artigo a alguns subsídios sobre o assunto.

Para usar os livros eletrônicos, é preciso comprá-los em alguma livraria online e usar um programa específico para converter do formato somente para leitura para um formato editável. O programa mais usado para esse fim é o Calibre. O Calibre, no entanto, apenas faz a conversão entre os formatos – caso o livro esteja protegido por DRM, será preciso adicionar um plugin ao programa para ele quebrar o DRM automaticamente. O plugin e as instruções de instalação podem ser encontrados neste blog especializado no assunto.