Lab'a Dön
Sahaf
Otomatik dijital/taranmış algılama, OCR desteği ve akıllı bölme özellikli yerel PDF & EPUB'dan Markdown'a dönüştürücü. Tamamen kendi donanımınızda çalışır.
Prototip
PDF & EPUB Desteği
Her iki format için ayrı pipeline. Dijital, taranmış ve karma PDF'leri sayfa sayfa otomatik algılar.
Yüksek Doğrulukta Dönüştürme
Marker kütüphanesi %95.67 doğruluk sağlar. Surya OCR motoru ile 90+ dil desteği.
Akıllı Bölme
Sayfa ve bölüm aralığı seçimi. Çıktıyı başlık ve paragraf sınırlarında böler, cümle ortasında değil.
Tamamen Yerel İşleme
Bulut API yok, veri makinenizden çıkmaz. İki dilli web arayüzü, sürükle-bırak, koyu/açık tema.
⚠ PDF dönüştürme için GPU şiddetle önerilir. GPU olmadan 27 sayfalık taranmış bir PDF'in dönüştürülmesi bir saatten fazla sürebilir. EPUB dönüştürme hafiftir ve herhangi bir donanımda anında çalışır.
Teknoloji
Python 3.10+FastAPI + UvicornMarker / Surya OCRPyMuPDFebooklib
Bağlantılar
GH
github.com/arikusi/sahaf
GitHub Deposu