c_number1058
tipP1_BUG_FIX
sto_trebaPopraviti fenix-v4 PDF ekstraktciju koja odsjeća stranice na 10. Kreirani novi modul limit_arhiva_1000_stranica.py koji čita SVE stranice bez limita koristeći omega/semantic.py pristup.
faze[
"FAZA 1: Kreiraj novi modul [DONE - /var/www/fenix-v4/tasks/limit_arhiva_1000_stranica.py]",
"FAZA 2: Konfigurira router.py za /api/v4/limit-arhiva-upload/ [PENDING]",
"FAZA 3: Poveži Genesis login callback [PENDING]",
"FAZA 4: Test s 800-page PDF [PENDING]",
"FAZA 5: Deploy na MAR produkcija [PENDING]"
]
zakon[
"ZAKON 1A: WeisE3ID + BunkerSeal + ZivaCigla",
"ZAKON 3: Trojna pohrana (Krunica + DokArh + Brsljani)",
"ZAKON 28: Cleanup task za istekle tokene",
"ZAKON 32: P1 fix mora imati chain entry (THIS)"
]
problem{
"fajl": "/var/www/fenix-v4/tasks/archive_tasks.py",
"funkcija": "_extract_text()",
"red": "160",
"kod": "for page in pdf.pages[:10]",
"efekt": "Od 800 stranica, čita samo 10. Gubi se 790 stranica OCR teksta, AI ekstraktcija, financijski podaci."
}
rjesenje{
"fajl": "/var/www/fenix-v4/tasks/limit_arhiva_1000_stranica.py",
"pristup": "Novo - omega/semantic.py ili pdfplumber BEZ [:10]",
"funkcija": "_extract_text_unlimited()",
"kod": "for page in pdf.pages (sve stranice, bez limita)",
"efekt": "Čita SVE stranice, čuva sve OCR, AI ekstraktciju, financijske podatke"
}
deploy{
"server": "EU (217.160.71.124) + MAR (212.227.181.201)",
"git_url": "https://limit-connect.com/git/ (pending commit)",
"test_pdf": "800 stranica - prije i nakon fix",
"regression": "Nema - stari archive_tasks.py ostaje nepromijenjen, novi modul je dodatni"
}
statusIN_PROGRESS