Recuperar textos de PDF, CHM y HTML

Text Mining Tool es un software gratuito que le permite extraer el texto de un documento PDF, una ayuda en línea CHM, una página HTML o un archivo RTF o DOC de un vistazo. Simplemente inicie el programa e indique el archivo que se le va a transcribir para ver el texto plano que se muestra en la pantalla. Depende de usted, entonces, exportar este texto o copiarlo/pegarlo….

En la práctica, el programa también es muy útil para recuperar el contenido de un archivo DOC dañado o un archivo PDF anormal e ilegible.

– Primero descargue el software siguiendo este enlace.
– Descomprima el archivo Zip en una carpeta.
– No es necesario instalar el software. Simplemente haga doble clic en el icono de TextMiningTool. De este modo, el programa se puede utilizar fácilmente, por ejemplo, desde un lápiz de memoria USB.
– Haga clic en el icono Abrir para cargar el archivo PDF, CHM, HTML, RTF o DOC.
– Después de unos segundos de análisis, se muestra la parte de texto del documento en su forma original (sin imagen, estilo, enriquecimiento o código de diseño).
– Haga clic en Guardar para guardar este texto en formato ASCII que se puede leer directamente desde el bloc de notas, por ejemplo.
– O haga clic en Portapapeles para copiar el texto completo en el portapapeles de Windows y pegarlo en un documento de Word u OpenOffice.org en el que esté trabajando.

Observaciones:
* Sucede que el software no descifra correctamente los acentos, especialmente en documentos HTML.
* En la ventana del software, puede seleccionar un bloque de texto y utilizar el acceso directo[Ctrl]+[C] para copiar esta selección en el portapapeles de Windows.

No Responses

Write a response