#!/usr/bin/env python3
from scripts.config import SOURCE_DIRS, EXCLUDE_DIRS, FINAL_POLKI
from scripts.processor import process_single_pdf
from pathlib import Path
import sys

print("=== Тестовый запуск обработчика ===")
print(f"Всего источников: {len(SOURCE_DIRS)}\n")

# Тестовый режим — обрабатываем ограниченное количество файлов
test_mode = True
max_files = 20   # Измените на 100-200 когда убедитесь, что всё работает

total_processed = 0

for source in SOURCE_DIRS:
    if not source.exists():
        print(f"❌ Папка не найдена: {source}")
        continue

    print(f"\n📂 Сканируем: {source}")
    
    pdf_files = list(source.rglob("*.pdf"))
    
    # Исключаем ненужные папки
    pdf_files = [f for f in pdf_files if not any(ex in f.parents for ex in EXCLUDE_DIRS)]
    
    print(f"   Найдено PDF: {len(pdf_files)}")

    for pdf in pdf_files[:max_files]:
        result = process_single_pdf(pdf)
        if result:
            total_processed += 1

    if test_mode and total_processed >= max_files:
        break

print(f"\n=== Тест завершён. Обработано файлов: {total_processed} ===")
print(f"Результаты смотрите в папке: {FINAL_POLKI['history']}")
