tito-pdf (guía rápida)
tito-pdf convierte .pdf / .docx a Markdown (y opcionalmente extrae tablas), de forma local/determinística (sin LLM).
Recomendado (salida explícita)
Usá --md-out para controlar el path del output:
tito-pdf input.pdf --md-out out/input.md
Convenience mode
Sin paths explícitos, escribe junto al input:
tito-pdf /path/al/doc.pdf
# => /path/al/doc.md
Con --out-dir:
tito-pdf doc.pdf --out-dir out
# => out/doc.md
Tablas:
tito-pdf doc.pdf --tables --out-dir out
# => out/doc.tables.md
Texto + tablas:
tito-pdf doc.pdf --all --out-dir out
Modos
--mode robust(default): OCR conservador + tablas estrictas--mode fast: sin OCR--mode best: fuerza OCR y reintenta tablas en modo lenient si no hay tablas en estricto
Más documentación
Flags: tito-pdf --help