Metadata-Version: 2.1
Name: amberpdf
Version: 0.1.3
Summary: Librería que procesa un PDF mixto (texto e imágenes/tablas) y extrae el contenido en orden
Home-page: https://github.com/amberpdf
Author: Paulo Suclly
Author-email: paulo.suclly@pucp.edu.pe
Classifier: Programming Language :: Python :: 3
Classifier: License :: OSI Approved :: MIT License
Classifier: Operating System :: OS Independent
Requires-Python: >=3.6
Description-Content-Type: text/markdown
License-File: LICENSE
Requires-Dist: PyMuPDF>=1.18.0
Requires-Dist: boto3>=1.26.0
Requires-Dist: pandas

# AmberPDF

Una librerÃ­a que procesa un PDF mixto (texto e imÃ¡genes/tablas) y extrae el contenido en orden.

## Instalacion

pip install amberpdf

## Uso

import amberpdf

# Configura las credenciales de AWS
amberpdf.credentials('tu_access_key_id', 'tu_secret_access_key')

# Procesa un PDF
text = amberpdf.process_pdf('ruta/al/archivo.pdf', pages = 0)   #"pages" es el nÃºmero de pÃ¡ginas que analizarÃ¡, inicia desde la primera pÃ¡gina

print(text)
