myPdf3
 

myPdf3 es una aplicación que convierte archivos Acrobat® pdf en XML. Extrae el texto de cada página, y la meta data (document/page/image).

myPdf3 soporta:

  • Hasta Pdf 1.6 (Acrobat 7.0)
  • Tipografías Type1, Multiple Master, TrueType, Open Type.
  • 'annotations' - 'links'
  • Win/Mac/Adobe/Custom encodings, UCS, Unicode Adobe® Glyph List
  • Adobe XMP
  • No requiere Adobe Acrobat ni librerías de terceras partes.
  • automatización - IAC
  • Windows® 2000/XP - Linux

Muestra: 

archivo original (391Kb)  archivo extraído (22Kb)

myPdf3 es open-sourcehttp://sourceforge.net/projects/mypdf3


 Descargar: demo Windows / demo Linux (la versión demo recorta el texto extraído)