Como converter textos em PDF para formato TXT
Deficientes visuais utilizam software de leitura de tela para terem acesso a textos disponibilizados de forma digital. Entretanto, a maioria dos textos em formato PDF (terminação .pdf) não foram produzidos de forma acessível, o que gera grande dificuldades para os deficientes visuais realizarem a leitura. Para que o leitor de tela funcione de forma apropriada, o melhor formato de arquivo é o TXT (terminação .txt), pois a disposição de suas informações em linhas facilita o processo de leitura do programa. Sendo assim, a seguir iremos explicar como realizar a conversão de textos em PDF para arquivos TXT. Mas já adiantamos, não existe uma ferramenta que converte de forma perfeita. Após, ainda é necessário ajustes manuais no texto para deixá-lo o mais correto possível.
Conversão por sistemas online
Existem diversos sites que oferecem esta conversão, por isso uma busca rápida na internet pelo termo “converter PDF em TXT” apresentará muitos resultados. O uso da ferramenta é muito simples e intuitivo, entretanto, pode acontecer da conversão não ficar boa e apresentar muitos erros, a ponto de não valer a pena ajustar. Então, faça um teste com alguns e escolha o resultado que gere menos ajustes possíveis. Sobre os ajustes, sugerimos que leia as Verificações importantes após o artigo convertido (fazer link interno para o conteúdo).
Conversão pelo Adobe Acrobat
Neste processo, alguns programas precisam estar instalados no seu computador, são eles: Adobe Acrobat e Microsoft Word ou LibreOffice. No teste que fizemos, esta forma gerou uma conversão melhor do que os conversores online, entretanto, cada documento é cada documento e os resultados podem ser diferentes dependendo do arquivo. Sobre os ajustes, sugerimos que leia as Verificações importantes após o artigo convertido (fazer link interno para o conteúdo).
Se optar por este procedimento, Conversão pelo Adobe Acrobat, você terá duas etapas de conversão:
- Etapa 1: converter de PDF para formato DOC usando o Adobe Acrobat;
- Etapa 2: converter de DOC para TXT usando o Microsoft Word ou o Libre Office.
A seguir, detalharemos os passos para realizar esta conversão.
ETAPA 1
1º Passo:
Abrir o arquivo PDF no Adobe Acrobat. Para isso, clique com o botão direito do mouse sobre o arquivo, escolha o menu “Abrir como” e clique na opção do software Adobe Acrobat.
Caminho: Botão direito do mouse/Abrir como / Adobe Acrobat
2º Passo:
Após abrir o arquivo no Adobe Acrobat, peça para salvar como arquivo Word. Para isso, selecione no menu superior a opção “File”, em seguida vá em “Save As”, depois vá na opção “Microsoft Word” e, por último, selecione “Word Document”.
Caminho: File/Save As/Microsoft Word/Word Document
Importante: Sugerimos que organize numa única pasta todos os arquivos.
ETAPA 2
3º Passo:
Abra o arquivo convertido no Microsoft Word ou LibreOffice e peça para “Salvar como”, depois escolha o formato Texto (.txt)
Caminho: File ou Arquivo/Save as ou Salvar como/tipo: Texto (.txt)
Importante: Você precisará escolher um local para salvar o arquivo, sugerimos salvar todos na mesma pasta até o fim do processo.
Caso apareça uma janela pedindo para confirmar o formato do arquivo, escolha a opção “Utilizar o formato Texto”.
4º Passo:
Após este processo, abra o arquivo TXT no software Bloco de Notas do seu computador.
Para isso, clique com o botão direito do mouse no novo arquivo com extensão .txt e procure por “Abrir Como”, em seguida escolha o “Bloco de Notas”.
Caminho: Botão direito do mouse/Abri como/Bloco de notas
Verificações importantes após o artigo convertido
Algumas verificações e adaptações devem ser feitas, principalmente quanto à organização ou formatação:
1. NOME DOS AUTORES E INFORMAÇÕES PESSOAIS
Em alguns artigos, as informações pessoas dos autores estão na forma de Nota de Rodapé. Sugerimos que o nome do(a) autor(a) e as informações sobre ele(a) sejam reorganizados na seguinte disposição: Nome do autor em seguida as informações que constam sobre ele na nota de rodapé do texto original. Veja, a seguir, um exemplo:
Exemplo do texto reorganizado:
Autores:
Carlos A. Gadia- Diretor associado, Dan Marino Child Nett, Dan Marino Center, Miami Children’s Hospital. Professor assistente, Departamento de Neurologia, Faculdade de Medicina, Universidade de Miami.
2. DADOS DE IDENTIFICAÇÃO DA PUBLICAÇÃO
Outra informação que também deve ser identificada e reorganizada é sobre o local de publicação. Recomenda-se evitar abreviações, sendo importante reorganizar a disposição das palavras de forma mais descritiva, numa espécie de texto corrido.
Exemplo de identificação de revista:
Exemplo alterado:
Artigo Publicado na Revista Brasileira de Educação Especial, Marília. Volume 20, número 1, página 147 a 162, Janeiro a Março de 2014.
3. INFORMAÇÕES REPETIDAS
Em arquivos de artigos científicos é comum aparecerem informações textuais repetidas em cabeçalhos ou rodapés, como o título do artigo, nome da revista, entre outros. Por isso, avalie as informações e posicione-as dentro do texto de forma única.
4. NOTAS DE RODAPÉ E REFERÊNCIAS NUMERADAS
As indicações de referências numeradas e as notas de rodapé também necessitam de uma atenção e ajuste. Quando o texto é convertido para TXT, as notas de rodapé perdem a formatação de sobrescrito e tornam-se um número solto no meio do texto, assim como as referências numeradas, dificultando para o deficiente visual compreender a sua função.
- No caso das referências bibliográficas numeradas: As referências bibliográficas ficam disponíveis ao final do artigo, com o seu respectivo título, de forma numerada. Quanto às citações ao longo da leitura do texto, sugerimos que sejam transformadas para o formato [Ref. número da referência] onde Ref. representa a abreviatura da palavra referência ou escrever a palavra Referência, ficando assim: [Ref. 5] ou [Referência 5].
- No caso das notas de rodapé: As notas de rodapé devem estar todas disponíveis ao final do artigo, antes das referências e com o título Notas, e organizadas em ordem crescente de numeração. As suas indicações ao longo da leitura do texto devem ser transformadas para o formato [Nota número da nota], ficando assim: [Nota 12].
Entretanto, para que o usuário entenda esta organização é necessário inserir no início do texto uma orientação. A seguir, colocamos uma sugestão de texto, que pode ser alterado de acordo com a sua necessidade:
- Bibliografia numerada: As referências bibliográficas estão disponíveis ao final do artigo de forma numerada. As citações ao longo da leitura do texto foram transformadas para o formato [Ref. número da referência], em que Ref. representa a abreviatura da palavra Referência e o número indica o número que a identifica na lista.
- Notas de rodapé: As notas de rodapé estão todas disponíveis ao final do artigo, antes das referências, e organizadas em ordem crescente de numeração. As suas indicações ao longo da leitura do texto foram transformadas para o formato [Nota número da nota], em que o número indica a numeração que a identifica na lista.
5. PALAVRAS COM FALTA DE CARACTERES
É muito comum, também, as palavras ficarem sem acentos, com alguns caracteres especiais e ausência do “ç”. Por isso é necessário fazer uma verificação detalhada no texto para ajustar estas inconformidades.
6. IMAGENS E GRÁFICOS
Caso o artigo tenha imagens (gráficos, desenhos, esquemas visuais, entre outros), eles não aparecem no arquivo TXT. Então, é necessário fazer a audiodescrição delas e colocar no local da imagem. Entretanto, é importante identificar quando começa e termina a audiodescrição, conforme o exemplo a seguir:
Figura 1 – Título da Figura
[início da audiodescrição] Texto que descreve toda a imagem. [fim da audiodescrição]
7. TABELA
Um problema também está nas tabelas que perdem toda a configuração. Diante disso, a sugestão é que seja feita a descrição em texto de seu conteúdo. Inicie com um parágrafo explicando o que ela está apresentando de informação, depois faça a descrição dos conteúdos, conforme exemplificamos a seguir:
Exemplo da descrição da tabela acima:
Tabela 2 – Questões de ordem escalar
[descrição da tabela] A tabela apresenta as perguntas e a quantidade de respostas que a pergunta teve na pesquisa, dentro da escola de 1 a 5. As perguntas estão organizadas em 3 grupos: Perguntas Gerais (perguntas 2 e 3), Compreensão e Estrutura (pergunta 4, 5, 9 10 e 13) e Vídeo (pergunta 14).
No grupo Perguntas Gerais, na pergunta 2 “O Moodle atende as necessidades do surdo na compreensão dos conteúdos?”, houve uma resposta na escala 1 e duas respostas na escala 2. Na pergunta 3 “Os recursos do Moodle (chat, fórum, vídeos, leituras e avaliações), são suficientes para a compreensão dos conteúdos?”, houve 3 respostas na escala 2.
No grupo Compreensão e Estrutura, a pergunta ….continuar [fim da descrição da tabela]
8. ASPECTOS LEGAIS
Ao adaptar o texto para o formato TXT, alguns ajustes na obra original são necessários. Estes ajustes são resguardados por leis e, para que você tenha mais segurança, recomendamos que coloque no início do texto a seguinte informação:
Este material está disponibilizado em formato PDF original e também em formato TXT para atender as necessidades de pessoas com deficiência visual que usam leitores de telas. Esta forma de reprodução não configura ofensa aos direitos autorais, visto que está assegurada pelo Art. 46, I, d da lei 9.610, de 19/12/1998 (Lei de Direito Autoral).
De forma geral, nossa sugestão é realizar a revisão de todo artigo para conferir as informações e a disposição de seus textos, tabelas e imagens.