Documents

Héberger Paperless-ngx sur un VPS : archivez et retrouvez tous vos documents

Numérisez vos papiers une bonne fois, et retrouvez n'importe quel document en deux mots-clés, sur votre propre serveur.

Remplace
GED, Evernote, classeurs papier
RAM conseillée
4 Go
Docker
Oui
Budget VPS
≈ 6–9 €/mois
Difficulté
Intermédiaire
En bref

Paperless-ngx transforme vos papiers scannés en archive cherchable : OCR, recherche plein texte, classement automatique. Comptez 2 Go de RAM mini, 4 Go confortables (app + Redis + PostgreSQL + Tika + Gotenberg pour l'OCR), ≈ 6–9 €/mois. Son atout en France : archiver factures, déclarations d'impôts et justificatifs sur un VPS européen (RGPD), et les retrouver en deux mots-clés.

Vous connaissez le tiroir. Celui qui déborde de factures, de relevés, de quittances de loyer, de bulletins de salaire et de courriers administratifs qu’on garde « au cas où ». Le jour où l’on cherche l’attestation de l’an dernier ou la facture d’un appareil encore sous garantie, c’est une demi-heure perdue à fouiller. Paperless-ngx est la réponse logicielle à ce problème : un système de gestion électronique de documents (GED) qui numérise vos papiers, en extrait le texte par OCR, et vous les fait retrouver en deux mots-clés.

Le principe est simple à décrire. Vous scannez un document — ou vous prenez une photo, ou vous déposez un PDF reçu par mail — et Paperless-ngx s’occupe du reste : il lit le contenu, le date, l’associe à un correspondant (votre fournisseur d’électricité, votre banque, l’URSSAF…), lui attribue un type (facture, contrat, avis d’imposition) et l’archive. Ensuite, une simple recherche plein texte suffit : tapez « EDF 2025 » et tous les documents correspondants remontent. Vous remplacez à la fois Evernote, une GED propriétaire et, surtout, les classeurs papier. La différence essentielle avec un service en ligne : tout cela tourne sur votre propre VPS, et vos documents les plus personnels ne quittent jamais votre serveur.

Pourquoi héberger sa GED plutôt qu’utiliser Evernote ou un classeur papier ?

La vraie question n’est pas seulement « est-ce plus pratique ? » — ça l’est nettement — mais « où vivent mes documents les plus sensibles ? ».

Le classeur papier a un défaut rédhibitoire : il n’est pas cherchable. Vous savez qu’un document existe, mais le retrouver dépend de votre classement et de votre mémoire. Un dégât des eaux, un déménagement ou un incendie, et tout disparaît. Les solutions en ligne type Evernote règlent la recherche, mais en échange vous confiez l’intégralité de vos papiers — fiches de paie, avis d’imposition, contrats, pièces d’identité scannées — à une entreprise dont le modèle économique repose sur l’analyse de la donnée, et dont vous subissez les changements de tarif et de conditions.

Paperless-ngx auto-hébergé réunit le meilleur des deux mondes. Vous gagnez la recherche instantanée et le classement automatique d’un outil moderne, sans céder vos documents à un tiers. Tout est stocké sur votre VPS : les fichiers originaux, leur version océrisée, vos étiquettes. Vous gardez vos données dans des formats ouverts (vos documents restent de simples PDF sur le disque), vous pouvez tout exporter quand vous voulez, et le logiciel est entièrement gratuit et open source. C’est la différence entre louer un service de stockage de documents et posséder son archive — une archive qui, hébergée en France ou en Europe, relève clairement du RGPD.

Configuration requise : combien de RAM pour Paperless-ngx ?

Configuration VPS requise
Processeur (CPU)2 vCPU
RAM minimale2 Go
RAM conseillée4 Go
Stockage20–40 Go SSD
DockerOui (image officielle)
Base de donnéesPostgreSQL + Redis
NiveauIntermédiaire

Paperless-ngx demande un peu plus de ressources que les applications les plus légères, et c’est normal : il n’est pas une seule brique, mais un orchestre de plusieurs conteneurs qui travaillent ensemble. Comprendre cette architecture, c’est comprendre son dimensionnement.

Au cœur, il y a l’application elle-même (le serveur web et ses workers d’indexation). Autour gravitent Redis, qui sert de file d’attente pour les tâches en arrière-plan (chaque document à traiter y passe), et une base de données PostgreSQL, qui stocke les métadonnées : titres, dates, correspondants, types, étiquettes. SQLite est possible pour un tout petit usage, mais PostgreSQL est recommandé dès qu’on accumule des milliers de documents. À cela s’ajoutent, pour l’OCR et la conversion avancés, deux conteneurs annexes : Gotenberg (qui convertit en PDF les fichiers bureautiques et les e-mails) et Tika (qui extrait le texte des documents Office). Cet ensemble explique pourquoi on ne tourne pas avec 512 Mo.

Concrètement : 2 Go de RAM constituent le minimum réaliste pour faire cohabiter ces services sur un usage léger. Mais dès que vous numérisez en volume — plusieurs dizaines ou centaines de pages d’un coup, des documents lourds, ou un import massif au démarrage —, l’OCR (gourmand en CPU et en mémoire) et les conteneurs Tika/Gotenberg font grimper la consommation. C’est pourquoi nous recommandons 4 Go de RAM pour une instance confortable : vous évitez les traitements qui s’éternisent ou échouent. Côté processeur, 2 vCPU font une vraie différence sur la vitesse d’OCR. Pour le stockage, comptez 20 à 40 Go de SSD : vos PDF originaux et leurs versions océrisées prennent de la place sur la durée. Si vous hésitez sur la machine, notre guide combien de RAM pour l’auto-hébergement détaille comment éviter le sous-dimensionnement qui mène aux plantages.

L’OCR en français : indexer ses documents scannés

C’est la fonction qui transforme Paperless-ngx d’un simple dossier de fichiers en véritable moteur de recherche documentaire. L’OCR (reconnaissance optique de caractères) lit le contenu visuel d’un document scanné — qui n’est, au départ, qu’une image — et en extrait le texte. Sans OCR, un scan de facture reste une photo : illisible pour la machine, donc introuvable par recherche. Avec OCR, son contenu devient cherchable mot à mot.

Paperless-ngx s’appuie sur Tesseract, le moteur OCR open source de référence, qui prend en charge le français nativement et avec une bonne précision, accents compris. Le réglage tient en une variable : PAPERLESS_OCR_LANGUAGE=fra (le code fra correspond au pack de langue française de Tesseract). Vous pouvez même cumuler plusieurs langues, par exemple fra+eng si vous recevez aussi des documents en anglais. Lors du traitement, Paperless-ngx applique l’OCR à chaque page, stocke le texte reconnu et génère un PDF cherchable : le document garde son apparence d’origine, mais on peut désormais sélectionner et chercher son texte.

Le résultat au quotidien est spectaculaire. Vous tapez « assurance habitation » dans la barre de recherche, et Paperless-ngx remonte tous les documents qui contiennent ces mots, même s’ils étaient à l’origine de simples photos de papiers. La recherche plein texte parcourt l’intégralité du contenu océrisé, pas seulement les titres. Concrètement, vous n’avez plus jamais besoin de vous souvenir où vous avez « rangé » un document : il suffit de vous souvenir de ce qu’il contient. C’est exactement ce qu’un classeur papier ne pourra jamais offrir.

Un cas d’usage français : factures, impôts, auto-entrepreneur

C’est là que Paperless-ngx prend tout son sens dans un contexte français, où l’administration impose de conserver ses justificatifs pendant des années. Prenons les durées concrètes : une déclaration de revenus et ses pièces se gardent au minimum trois ans (délai de reprise de l’administration fiscale) ; les factures et documents liés à un bien, parfois beaucoup plus longtemps. Empiler tout ça dans un tiroir fonctionne… jusqu’au jour où l’on doit retrouver une pièce précise.

Avec Paperless-ngx, vous bâtissez une archive vivante. À chaque avis d’imposition, chaque facture, chaque attestation reçue, vous déposez le document et l’outil le classe. Vous définissez des correspondants (Direction générale des finances publiques, URSSAF, votre banque, votre fournisseur d’énergie, votre mutuelle) et des types de document (avis d’imposition, facture, contrat, fiche de paie, justificatif de domicile). Le jour d’une déclaration ou d’un contrôle, vous filtrez par correspondant et par année, et vous avez sous les yeux l’intégralité du dossier en quelques secondes.

Pour un auto-entrepreneur ou un micro-entrepreneur, l’intérêt est encore plus net. Vous devez archiver vos factures émises, vos justificatifs de dépenses et vos déclarations URSSAF, et pouvoir les présenter en cas de demande. Paperless-ngx automatise une grande partie du tri : on peut créer des règles de classement automatique qui repèrent un mot-clé dans le texte océrisé et appliquent seules le bon correspondant, le bon type et la bonne étiquette. Une facture qui contient « URSSAF » ? Elle est automatiquement étiquetée « cotisations sociales » et rangée. Au fil des mois, votre comptabilité de justificatifs se constitue presque sans effort, et reste consultable à la moindre recherche — le tout sur votre serveur, sans qu’aucune de ces données fiscales sensibles ne transite par un service tiers.

Combien coûte l’auto-hébergement de Paperless-ngx ?

Soyons honnêtes, comme toujours. Le logiciel Paperless-ngx est entièrement gratuit et open source : vous ne payez aucune licence, aucun abonnement, aucune fonction « premium » bridée. Votre seul coût, c’est le VPS sur lequel il tourne. Et comparé aux applications les plus légères, Paperless-ngx est un peu plus exigeant, car il fait tourner cinq conteneurs (application, Redis, PostgreSQL, Tika, Gotenberg).

Comptez réalistement 6 à 9 €/mois pour un VPS adapté : autour de 6 € pour une machine 2 Go de RAM en usage modéré, plutôt 8-9 € pour 4 Go si vous numérisez beaucoup et voulez de la marge pour l’OCR. À l’année, on est sur 70 à une centaine d’euros. Ce n’est pas « gratuit », mais il faut comparer à ce qu’on remplace : une GED commerciale en abonnement coûte bien davantage, et un service en ligne « gratuit » se paie en données personnelles.

La vraie question est donc : qu’est-ce que vous archivez ? Si c’est trois factures par an, un dossier de fichiers bien rangé suffit, inutile d’investir. Mais si vous brassez un volume réel de papiers administratifs — un foyer entier, ou l’activité d’un auto-entrepreneur — alors quelques euros par mois pour ne plus jamais perdre un document, le retrouver en deux secondes, et le savoir hébergé en Europe sous votre contrôle, c’est un excellent arbitrage. Et ce même VPS peut héberger d’autres services (gestionnaire de mots de passe, outils PDF, notes), ce qui dilue le coût réel de Paperless-ngx.

Quel hébergeur choisir pour Paperless-ngx ?

Quel hébergeur choisir ?

Vos documents personnels et administratifs méritent un hébergeur européen (RGPD) ; prévoyez 4 Go de RAM si vous numérisez beaucoup (OCR).

OVHcloud

L'option française, Docker préinstallé

  • Image VPS « Docker » préinstallée disponible
  • Datacenters en France (latence + RGPD)
  • Documentation francophone fournie
Config conseillée
2 vCPU / 4 Go / 80 Go SSD
Prix indicatif
≈ 6–8 €/mois
Docker
Image Docker préinstallée proposée au déploiement
Voir les VPS OVHcloud lien à brancher

Infomaniak

La souveraineté des données

  • Hébergeur suisse indépendant, très axé vie privée
  • VPS Lite abordables, Docker via documentation
  • Énergie renouvelable, datacenters en Suisse
Config conseillée
2 vCPU / 4 Go / 80 Go NVMe
Prix indicatif
≈ 6–9 €/mois
Docker
VPS complet — Docker à installer (doc fournie)
Voir les VPS Infomaniak lien à brancher

Hetzner

Le meilleur rapport puissance/prix

  • VPS CX22 : 2 vCPU, 4 Go RAM, 40 Go SSD
  • L'hébergeur favori de la communauté self-hosting
  • Datacenters en UE (conformité RGPD)
Config conseillée
2 vCPU / 4 Go / 40 Go SSD
Prix indicatif
≈ 4,50 €/mois
Docker
VPS complet — Docker à installer (ou image Coolify en 1 clic)
Voir les VPS Hetzner lien à brancher

Transparence : les liens ci-dessus sont des liens partenaires (affiliation). Si vous souscrivez via l'un d'eux, ce site touche une commission, sans surcoût pour vous. Cela n'influence pas nos recommandations : nous ne citons que des hébergeurs adaptés à cette application. En savoir plus.

Le choix d’hébergeur compte particulièrement ici, car vous y déposez vos papiers les plus personnels : fiches de paie, avis d’imposition, contrats, justificatifs. Deux critères priment : la localisation juridique des données et la RAM disponible pour l’OCR.

OVHcloud est le réflexe naturel pour rester en France : datacenters hexagonaux, droit français, conformité RGPD native et documentation francophone. Pensez à une offre avec au moins 4 Go de RAM si vous prévoyez de gros imports. Infomaniak, en Suisse, séduit ceux qui veulent une législation sur la vie privée parmi les plus strictes au monde, tout en restant proches géographiquement. Hetzner, en Allemagne, offre le meilleur rapport puissance/prix de la sélection : son VPS à 4 Go de RAM est idéal pour faire tourner les cinq conteneurs de Paperless-ngx sans se ruiner. Les trois garantissent que vos documents ne quittent jamais l’espace juridique européen, contrairement à un hébergeur américain soumis au Cloud Act.

Installer Paperless-ngx sur un VPS avec Docker

L’installation repose sur Docker Compose, qui orchestre les cinq services. On part d’un VPS où Docker et Docker Compose sont installés, puis on crée un fichier docker-compose.yml. Voici une configuration réaliste, avec l’OCR en français activé d’emblée et les conteneurs Tika/Gotenberg pour traiter aussi les e-mails et fichiers bureautiques :

services:
  broker:
    image: redis:8
    container_name: paperless_broker
    restart: unless-stopped
    volumes:
      - redisdata:/data

  db:
    image: postgres:16
    container_name: paperless_db
    restart: unless-stopped
    volumes:
      - pgdata:/var/lib/postgresql/data
    environment:
      POSTGRES_DB: paperless
      POSTGRES_USER: paperless
      POSTGRES_PASSWORD: mot_de_passe_db_solide

  gotenberg:
    image: gotenberg/gotenberg:8
    container_name: paperless_gotenberg
    restart: unless-stopped
    command:
      - "gotenberg"
      - "--chromium-disable-javascript=true"
      - "--chromium-allow-list=file:///tmp/.*"

  tika:
    image: apache/tika:latest
    container_name: paperless_tika
    restart: unless-stopped

  webserver:
    image: ghcr.io/paperless-ngx/paperless-ngx:latest
    container_name: paperless_webserver
    restart: unless-stopped
    depends_on:
      - broker
      - db
      - gotenberg
      - tika
    ports:
      - "127.0.0.1:8000:8000"
    volumes:
      - data:/usr/src/paperless/data
      - media:/usr/src/paperless/media
      - ./export:/usr/src/paperless/export
      - ./consume:/usr/src/paperless/consume
    environment:
      PAPERLESS_REDIS: redis://broker:6379
      PAPERLESS_DBHOST: db
      PAPERLESS_DBNAME: paperless
      PAPERLESS_DBUSER: paperless
      PAPERLESS_DBPASS: mot_de_passe_db_solide
      PAPERLESS_URL: https://documents.mondomaine.fr
      PAPERLESS_TIME_ZONE: Europe/Paris
      # OCR en français (Tesseract). Cumulez avec fra+eng si besoin.
      PAPERLESS_OCR_LANGUAGE: fra
      # Activation de Tika + Gotenberg (e-mails et fichiers Office)
      PAPERLESS_TIKA_ENABLED: 1
      PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000
      PAPERLESS_TIKA_ENDPOINT: http://tika:9998

volumes:
  redisdata:
  pgdata:
  data:
  media:

On lance ensuite toute la pile :

docker compose up -d

Au premier démarrage, la base s’initialise (cela peut prendre une minute). Il faut ensuite créer votre compte administrateur, qui n’existe pas par défaut :

docker compose run --rm webserver createsuperuser

Paperless-ngx répond alors sur http://127.0.0.1:8000. Comme on a lié le port à 127.0.0.1, l’application n’est pas exposée directement : c’est voulu. Reste l’étape de sécurisation pour un accès en ligne, à savoir placer un reverse proxy HTTPS (Caddy, Nginx Proxy Manager ou Traefik) devant le port 8000, pour obtenir un certificat Let’s Encrypt et chiffrer le trafic. Avec Caddy, cela tient en deux lignes :

documents.mondomaine.fr {
    reverse_proxy localhost:8000
}

Une fois en ligne, le flux de travail est limpide : vous déposez vos fichiers dans le dossier consume (ou vous configurez votre scanner pour y écrire directement), et Paperless-ngx les avale, les océrise en français et les classe automatiquement. Pour aller plus loin dans la manipulation de PDF — fusionner, compresser, signer avant archivage — vous pouvez l’associer à Stirling-PDF auto-hébergé, qui complète parfaitement Paperless-ngx sur le même VPS.


Paperless-ngx demande un peu plus d’effort de mise en place qu’une application mono-conteneur, mais il offre en retour quelque chose de rare : la fin du tiroir à papiers, remplacé par une archive cherchable, durable et entièrement privée, hébergée sous le droit français ou européen. Une fois en place, vos factures, impôts et justificatifs ne sont plus jamais perdus — ils sont à deux mots-clés. Si vous n’avez pas encore choisi votre machine, notre comparatif quel VPS pour l’auto-hébergement vous aidera à dimensionner correctement votre serveur, en gardant à l’esprit ces 4 Go de RAM utiles dès qu’on numérise sérieusement.

Questions fréquentes

Combien de RAM faut-il vraiment pour Paperless-ngx ?

2 Go de RAM suffisent pour démarrer et un usage léger. Mais Paperless-ngx ne tourne jamais seul : il s'accompagne de Redis, d'une base PostgreSQL et, pour l'OCR avancé, des conteneurs Tika et Gotenberg. Si vous numérisez beaucoup de documents, visez 4 Go de RAM pour que l'indexation et l'OCR restent fluides.

L'OCR de Paperless-ngx fonctionne-t-il en français ?

Oui. Paperless-ngx s'appuie sur Tesseract, qui gère parfaitement le français. Il suffit de renseigner PAPERLESS_OCR_LANGUAGE=fra dans la configuration. Vos documents scannés deviennent alors cherchables en texte intégral, accents compris.

Puis-je archiver mes factures et documents d'impôts dedans ?

C'est précisément son usage le plus courant en France. Factures, avis d'imposition, fiches de paie, justificatifs d'auto-entrepreneur : vous les scannez, Paperless-ngx les indexe, applique des correspondants et des types de document, et les retrouve instantanément le jour d'un contrôle ou d'une déclaration.

Faut-il un scanner spécial pour l'utiliser ?

Non. N'importe quel scanner, imprimante multifonction ou même l'appareil photo de votre téléphone fait l'affaire. Paperless-ngx surveille un dossier « consume » : tout fichier déposé dedans (PDF, JPG, PNG) est automatiquement traité, océrisé et classé.

Mes documents restent-ils privés et conformes au RGPD ?

Oui, c'est tout l'intérêt face à Evernote ou un service de GED en ligne. Vos documents vivent sur votre VPS, idéalement loué chez un hébergeur français (OVHcloud) ou européen (Infomaniak, Hetzner). Aucune donnée personnelle ne part chez un tiers soumis au Cloud Act.

Comment sauvegarder mon archive documentaire ?

Sauvegardez trois choses : la base PostgreSQL (un pg_dump régulier), le dossier media (vos documents originaux et leurs versions océrisées) et votre configuration. Un cron quotidien qui chiffre et envoie ces éléments hors du VPS vous protège d'une panne disque.