Ex Tunc — L'IA qui libère les avocats des nullités de procédure

En Comparution Immédiate, les avocats pénalistes ont moins de 10 minutes pour analyser des dossiers de 40+ pages et identifier les vices de procédure qui pourraient invalider une garde à vue. Ces nullités sont cachées dans des timestamps dispersés à travers des PV mal scannés qu'il faut recouper manuellement. Un travail de 45 minutes minimum, alors qu'ils sont assis dans les couloirs du tribunal.

Ex Tunc automatise cette analyse pour transformer ce cauchemar logistique en un avantage stratégique.

Comment ça marche

L'IA analyse les dossiers via un pipeline technique en 3 temps :

  1. Ingestion Hybride (OCR) :

    • Documents numériques : Extraction native instantanée (< 1s).
    • Scans dégradés (tampons, carbones) : Rendu Image HD + Google Cloud Vision OCR pour une précision maximale, contournant les problèmes d'encodage classiques.
  2. Intelligence Temporelle (Regex + Gemma 3) :

    • Les timestamps (T₀, T₁) sont chassés par des Regex complexes (approche déterministe).
    • En cas d'ambiguïté ou d'erreur OCR, Gemma 3 (via Featherless) intervient pour comprendre le contexte et corriger les "typos" de numérisation ou lire les heures écrites en toutes lettres.
  3. Moteur de Nullité (TypeScript) :

    • Un algorithme strict vérifie les délais légaux (Art 63-1 CPP) et la compétence des signataires (OPJ/APJ).
    • Génération automatique des Conclusions in Limine Litis prêtes à plaider.

Règles de détection MVP

  • Si (T₁ - T₀) > 45 min sans justification → Notification tardive (A1)
  • Si signataire ≠ "OPJ" → Incompétence de l'auteur (B1)
  • Si (T₂ - T₁) > 1h → Avis parquet tardif (A2 - Roadmap)

Challenges Techniques & Solutions

Challenge #1 : OCR sur documents dégradés Les PV sont souvent des "scans de scans".

  • Solution : Pipeline PDF-to-Image (pdfjs/canvas) qui rend chaque page en haute définition avant de l'envoyer à l'OCR de Google Cloud Vision. Résultat : 99% de taux de lecture.

Challenge #2 : Extraction des timestamps Les heures sont exprimées en clair ("quatorze heures") ou mal formattées ("14:OO").

  • Solution : Architecture "Regex-First, LLM-Fallback". On combine la vitesse du code classique avec l'intelligence sémantique de Gemma 3 pour les cas limites.

Challenge #3 : Latence < 10 minutes

  • Solution : Architecture Serverless (Firebase Functions) avec traitement asynchrone pour passer sous la barre des 15 secondes par dossier.

Challenge #4 : Output juridique exploitable

  • Solution : Templates de conclusions juridiques dynamiques avec insertion automatique des références aux cotes (ex: "Cote D4").

Challenge #5 : Confidentialité des Données (RGPD) Les noms des mis en cause ne doivent pas fuiter.

  • Solution : Anonymiseur Regex intégré par défaut. Avant même que le texte ne soit analysé par l'IA ou renvoyé, un filtre "Privacy by Design" supprime tous les noms propres (Nom : DUPONT -> Nom : [ANONYMISÉ]) et dates de naissance.

Impact

  • Gain de temps : De 45 min à < 2 min d'analyse
  • Exhaustivité : Zéro nullité manquée grâce au double contrôle (Regex + IA)
  • Accessibilité : Nivelez le terrain pour les avocats commis d'office face aux parquets

Limites & Pistes d'évolution

Les Limites Actuelles

  • Dépendance Cloud : L'utilisation de Google Cloud Vision et Featherless induit un coût par dossier (~0.05€).
  • Contexte Statique : L'IA analyse le PV page par page ou document par document, sans encore croiser les informations complexes dispersées sur l'intégralité du dossier (ex: l'heure de l'avis avocat qui contredit l'heure d'interpellation située 30 pages avant).
  • Confidentialité : Bien que les Cloud Functions soient "stateless" (les données ne sont pas conservées), les fichiers quittent temporairement l'appareil. Une solution "On-Premise" ou "Local-First" serait idéale pour certains cabinets ultra-sécurisés.

Built With

Share this project:

Updates