Como converter textos em PDF para formato TXT

Deficientes visuais utilizam software de leitura de tela para terem acesso a textos disponibilizados de forma digital. Entretanto, a maioria dos textos em formato PDF (terminação .pdf) não foram produzidos de forma acessível, o que gera grande dificuldades para os deficientes visuais realizarem a leitura. Para que o leitor de tela funcione de forma apropriada, o melhor formato de arquivo é o TXT (terminação .txt), pois a disposição de suas informações em linhas facilita o processo de leitura do programa. Sendo assim, a seguir iremos explicar como realizar a conversão de textos em PDF para arquivos TXT. Mas já adiantamos, não existe uma ferramenta que converte de forma perfeita. Após, ainda é necessário ajustes manuais no texto para deixá-lo o mais correto possível.

Conversão por sistemas online

Existem diversos sites que oferecem esta conversão, por isso uma busca rápida na internet pelo termo “converter PDF em TXT” apresentará muitos resultados. O uso da ferramenta é muito simples e intuitivo, entretanto, pode acontecer da conversão não ficar boa e apresentar muitos erros, a ponto de não valer a pena ajustar. Então, faça um teste com alguns e escolha o resultado que gere menos ajustes possíveis. Sobre os ajustes, sugerimos que leia as Verificações importantes após o artigo convertido (fazer link interno para o conteúdo).

Conversão pelo Adobe Acrobat

Neste processo, alguns programas precisam estar instalados no seu computador, são eles: Adobe Acrobat e Microsoft Word ou LibreOffice. No teste que fizemos, esta forma gerou uma conversão melhor do que os conversores online, entretanto, cada documento é cada documento e os resultados podem ser diferentes dependendo do arquivo. Sobre os ajustes, sugerimos que leia as Verificações importantes após o artigo convertido (fazer link interno para o conteúdo).

Se optar por este procedimento, Conversão pelo Adobe Acrobat, você terá duas etapas de conversão:

A seguir, detalharemos os passos para realizar esta conversão.

ETAPA 1

1º Passo:

Abrir o arquivo PDF no Adobe Acrobat. Para isso, clique com o botão direito do mouse sobre o arquivo, escolha o menu “Abrir como” e clique na opção do software Adobe Acrobat.

Caminho: Botão direito do mouse/Abrir como / Adobe Acrobat

[início da audiodescrição] a imagem mostra as telas indicando o caminho informado acima para abrir o arquivo [fim]

2º Passo:

Após abrir o arquivo no Adobe Acrobat, peça para salvar como arquivo Word. Para isso, selecione no menu superior a opção “File”, em seguida vá em “Save As”, depois vá  na opção “Microsoft Word” e, por último, selecione “Word Document”.

Caminho: File/Save As/Microsoft Word/Word Document

Importante: Sugerimos que organize numa única pasta todos os arquivos.

[início da audiodescrição] a imagem mostra as telas indicando o caminho informado acima para abrir o arquivo [fim]

ETAPA 2

3º Passo:

Abra o arquivo convertido no Microsoft Word ou LibreOffice e peça para “Salvar como”, depois escolha o formato Texto (.txt)

Caminho: File ou Arquivo/Save as ou Salvar como/tipo: Texto (.txt)

Importante: Você precisará escolher um local para salvar o arquivo, sugerimos salvar todos na mesma pasta até o fim do processo.

[início da audiodescrição] a imagem mostra as telas indicando o caminho informado acima para abrir o arquivo [fim]

Caso apareça uma janela pedindo para confirmar o formato do arquivo, escolha a opção “Utilizar o formato Texto”.

[início da audiodescrição] a imagem mostra as telas indicando o caminho informado acima para abrir o arquivo [fim]

4º Passo:

Após este processo, abra o arquivo TXT no software Bloco de Notas do seu computador.
Para isso, clique com o botão direito do mouse no novo arquivo com extensão .txt e procure por “Abrir Como”, em seguida escolha o “Bloco de Notas”.

Caminho: Botão direito do mouse/Abri como/Bloco de notas

[início da audiodescrição] a imagem mostra as telas indicando o caminho informado acima para abrir o arquivo [fim]


Verificações importantes após o artigo convertido

Algumas verificações e adaptações devem ser feitas, principalmente quanto à organização ou formatação:

1. NOME DOS AUTORES E INFORMAÇÕES PESSOAIS

Em alguns artigos, as informações pessoas dos autores estão na forma de Nota de Rodapé. Sugerimos que o nome do(a) autor(a) e as informações sobre ele(a) sejam reorganizados na seguinte disposição: Nome do autor em seguida as informações que constam sobre ele na nota de rodapé do texto original. Veja, a seguir, um exemplo:

IMAGEM 7

IMAGEM 8

 

Exemplo do texto reorganizado:

Autores:
Carlos A. Gadia- Diretor associado, Dan Marino Child Nett, Dan Marino Center, Miami Children’s Hospital. Professor assistente, Departamento de Neurologia, Faculdade de Medicina, Universidade de Miami.

2. DADOS DE IDENTIFICAÇÃO DA PUBLICAÇÃO

Outra informação que também deve ser identificada e reorganizada é sobre o local de publicação. Recomenda-se evitar abreviações, sendo importante reorganizar a disposição das palavras de forma mais descritiva, numa espécie de texto corrido.

Exemplo de identificação de revista:

IMAGEM 9

Exemplo alterado:

Artigo Publicado na Revista Brasileira de Educação Especial, Marília. Volume 20, número 1, página 147 a 162, Janeiro a Março de 2014.

3. INFORMAÇÕES REPETIDAS

Em arquivos de artigos científicos é comum aparecerem informações textuais repetidas em cabeçalhos ou rodapés, como o título do artigo, nome da revista, entre outros. Por isso, avalie as informações e posicione-as dentro do texto de forma única.

4. NOTAS DE RODAPÉ E REFERÊNCIAS NUMERADAS

As indicações de referências numeradas e as notas de rodapé também necessitam de uma atenção e ajuste. Quando o texto é convertido para TXT, as notas de rodapé perdem a formatação de sobrescrito e tornam-se um número solto no meio do texto, assim como as referências numeradas, dificultando para o deficiente visual compreender a sua função.

Entretanto, para que o usuário entenda esta organização é necessário inserir no início do texto uma orientação. A seguir, colocamos uma sugestão de texto, que pode ser alterado de acordo com a sua necessidade:

5. PALAVRAS COM FALTA DE CARACTERES

É muito comum, também, as palavras ficarem sem acentos, com alguns caracteres especiais e ausência do “ç”. Por isso é necessário fazer uma verificação detalhada no texto para ajustar estas inconformidades.

6. IMAGENS E GRÁFICOS

Caso o artigo tenha imagens (gráficos, desenhos, esquemas visuais, entre outros), eles não aparecem no arquivo TXT. Então, é necessário fazer a audiodescrição delas e colocar no local da imagem. Entretanto, é importante identificar quando começa e termina a audiodescrição, conforme o exemplo a seguir:

Figura 1 – Título da Figura
[início da audiodescrição] Texto que descreve toda a imagem. [fim da audiodescrição]

7. TABELA

Um problema também está nas tabelas que perdem toda a configuração. Diante disso, a sugestão é que seja feita a descrição em texto de seu conteúdo. Inicie com um parágrafo explicando o que ela está apresentando de informação, depois faça a descrição dos conteúdos, conforme exemplificamos a seguir:

IMAGEM 10

Exemplo da descrição da tabela acima:

Tabela 2 – Questões de ordem escalar
[descrição da tabela] A tabela apresenta as perguntas e a quantidade de respostas que a pergunta teve na pesquisa, dentro da escola de 1 a 5. As perguntas estão organizadas em 3 grupos: Perguntas Gerais (perguntas 2 e 3), Compreensão e Estrutura (pergunta 4, 5, 9 10 e 13) e Vídeo (pergunta 14).

No grupo Perguntas Gerais, na pergunta 2 “O Moodle atende as necessidades do surdo na compreensão dos conteúdos?”, houve uma resposta na escala 1 e duas respostas na escala 2. Na pergunta 3 “Os recursos do Moodle (chat, fórum, vídeos, leituras e avaliações), são suficientes para a compreensão dos conteúdos?”, houve 3 respostas na escala 2.

No grupo Compreensão e Estrutura, a pergunta ….continuar [fim da descrição da tabela]

8. ASPECTOS LEGAIS

Ao adaptar o texto para o formato TXT, alguns ajustes na obra original são necessários. Estes ajustes são resguardados por leis e, para que você tenha mais segurança, recomendamos que coloque no início do texto a seguinte informação:

Este material está disponibilizado em formato PDF original e também em formato TXT para atender as necessidades de pessoas com deficiência visual que usam leitores de telas. Esta forma de reprodução não configura ofensa aos direitos autorais, visto que está assegurada pelo Art. 46, I, d da lei 9.610, de 19/12/1998 (Lei de Direito Autoral).

De forma geral, nossa sugestão é realizar a revisão de todo artigo para conferir as informações e a disposição de seus textos, tabelas e imagens.