← DokArh Portal
P1_BUG_FIX

P1 Fix: Archive 800-Page PDF Limitation

Kreator: genesis Datum: 2026-05-21 Status: IN_PROGRESS
WeisE3™ ID: (nema)
c_number1058
tipP1_BUG_FIX
sto_trebaPopraviti fenix-v4 PDF ekstraktciju koja odsjeća stranice na 10. Kreirani novi modul limit_arhiva_1000_stranica.py koji čita SVE stranice bez limita koristeći omega/semantic.py pristup.
faze[ "FAZA 1: Kreiraj novi modul [DONE - /var/www/fenix-v4/tasks/limit_arhiva_1000_stranica.py]", "FAZA 2: Konfigurira router.py za /api/v4/limit-arhiva-upload/ [PENDING]", "FAZA 3: Poveži Genesis login callback [PENDING]", "FAZA 4: Test s 800-page PDF [PENDING]", "FAZA 5: Deploy na MAR produkcija [PENDING]" ]
zakon[ "ZAKON 1A: WeisE3ID + BunkerSeal + ZivaCigla", "ZAKON 3: Trojna pohrana (Krunica + DokArh + Brsljani)", "ZAKON 28: Cleanup task za istekle tokene", "ZAKON 32: P1 fix mora imati chain entry (THIS)" ]
problem{ "fajl": "/var/www/fenix-v4/tasks/archive_tasks.py", "funkcija": "_extract_text()", "red": "160", "kod": "for page in pdf.pages[:10]", "efekt": "Od 800 stranica, čita samo 10. Gubi se 790 stranica OCR teksta, AI ekstraktcija, financijski podaci." }
rjesenje{ "fajl": "/var/www/fenix-v4/tasks/limit_arhiva_1000_stranica.py", "pristup": "Novo - omega/semantic.py ili pdfplumber BEZ [:10]", "funkcija": "_extract_text_unlimited()", "kod": "for page in pdf.pages (sve stranice, bez limita)", "efekt": "Čita SVE stranice, čuva sve OCR, AI ekstraktciju, financijske podatke" }
deploy{ "server": "EU (217.160.71.124) + MAR (212.227.181.201)", "git_url": "https://limit-connect.com/git/ (pending commit)", "test_pdf": "800 stranica - prije i nakon fix", "regression": "Nema - stari archive_tasks.py ostaje nepromijenjen, novi modul je dodatni" }
statusIN_PROGRESS