OPEN SOURCE · APACHE 2.0 OPEN SOURCE · APACHE 2.0

Anonymisation PII
pour les pipelines LLM.
Local. Gratuit. Sans inscription.
PII redaction
for LLM pipelines.
Local. Free. No signup.

Détecte et tokenise les données sensibles avant tout appel à une API LLM. Tourne entièrement sur votre machine — aucune donnée ne quitte votre infra, aucun compte requis. Redact and tokenize sensitive data before it hits any LLM API. Runs entirely on your machine — no data leaves your infra, no account required.

17 types PII PII types
161 tests verts passing tests
0€ pour toujours forever
17 types d'entités PII PII entity types
6 politiques compliance compliance policies
5ms scan p50 scan p50
161 tests, 83% couverture tests, 83% coverage
0€ pour toujours to run forever

Tout ce qu'il vous faut Everything you need

Zéro dépendance cloud. Branchez et protégez. Zero cloud dependency. Plug in and protect.

🔍
Détection PII PII Detection

Regex + heuristiques, précision 1.00 sur dataset de validation. 17 types d'entités EN et FR. Regex + heuristics, precision 1.00 on validation dataset. 17 entity types across EN and FR.

🔐
Vault Fernet AES-256 Fernet AES-256 Vault

Tokenisation réversible. Valeurs originales stockées chiffrées localement, restituables à la demande. Reversible tokenization. Original values stored encrypted locally, restorable on demand.

📋
Politiques Compliance Compliance Policies

Intégré : RGPD, HIPAA, PCI-DSS, strict, modéré, permissif. Politiques personnalisées via API. Built-in: GDPR, HIPAA, PCI-DSS, strict, moderate, permissive. Custom policies via API.

🖥️
Dashboard Next.js Next.js Dashboard

Scanner, navigateur vault, journal d'audit, rapports, config webhooks. 15 langues via next-intl. Scanner, vault browser, audit log, reports, webhook config. 15 languages via next-intl.

🐍
SDK Python Python SDK

Wrappers drop-in pour clients OpenAI et Anthropic. La redaction est transparente pour votre code. Drop-in wrappers for OpenAI and Anthropic clients. Redaction is transparent to your code.

📊
Audit & Rapports Audit & Reports

Traçabilité complète, export PDF, résumés compliance, dispatch webhook sur événements. Full audit trail, PDF export, compliance summaries, webhook dispatch on events.

17 types de données sensibles 17 sensitive data types

Couvrant les données personnelles, financières, médicales et credentials. Covering personal, financial, medical data and credentials.

EMAIL PHONE_NUMBER CREDIT_CARD IBAN SSN PASSPORT IP_ADDRESS URL DATE_OF_BIRTH NAME ADDRESS MEDICAL_RECORD NPI API_KEY JWT_TOKEN AWS_KEY BITCOIN_ADDRESS

Lancé en 3 commandes Up in 3 commands

# 1. Clone
git clone https://github.com/MAXIAWORLD/guardforge.git
cd guardforge

# 2. Configure
cp backend/.env.example backend/.env

# 3. Run
docker compose up

# → Dashboard  http://localhost:3003
# → API        http://localhost:8004
# → API docs   http://localhost:8004/docs

Limites honnêtes Honest limitations

  • Regex uniquement — pas de ML NER (Presidio, spaCy). Fonctionne bien pour les PII structurées, moins pour les noms libres dans de longs textes. Regex-only — no ML NER (Presidio, spaCy). Works well for structured PII, less so for free-form names in long text.
  • SQLite uniquement — pas encore d'adaptateur PostgreSQL pour le vault. SQLite only — no PostgreSQL vault adapter yet.
  • Pas d'isolation multi-tenant — conçu pour usage self-hosted mono-utilisateur / équipe. No multi-tenant isolation — designed for single-user / team self-hosted use.
  • Pas de streaming — stream=True lève NotImplementedError explicitement. No streaming support — stream=True raises NotImplementedError explicitly.
  • Détection SIREN/SIRET désactivée par défaut (taux de faux positifs élevé). SIREN/SIRET detection disabled by default (high false-positive rate).

Voir la documentation complète des limites → Full limitations documentation →