Modifier un PDF, c’est souvent un véritable casse-tête, surtout lorsqu’il s’agit d’un fichier ne contenant que des images sans texte sélectionnable. Soit vous disposez d’Adobe Acrobat, qui coûte une fortune, soit vous devez vous contenter d’outils en ligne peu fiables, soit encore vous exportez le document en Word en espérant que la mise en page reste intacte. Bref, vous vous trouvez dans une situation peu enviable…
Cependant, tout cela était avant l’avènement de Nano-PDF, qui propose une méthode complètement innovante : il vous suffit de décrire en langage naturel ce que vous souhaitez modifier, et l’IA se charge du reste.
Par exemple, si votre présentation PDF contient une coquille sur la diapositive numéro 5, au lieu de vous embêter avec un éditeur, vous n’avez qu’à entrer :
Et voilà, le problème est résolu. Vous souhaitez actualiser un graphique avec les données de 2025 ? De la même façon, décrivez le changement et l’outil s’en charge !
Nano-PDF utilise le modèle Gemini 3 Pro Image de Google (surnommé “Nano Banana Pro”) pour interpréter vos instructions et produire les modifications visuelles. Le processus technique est d’ailleurs bien pensé puisque les pages PDF sont transformées en images via Poppler, envoyées au modèle avec votre commande, puis les images créées sont reconverties en PDF avec une couche de texte restaurée par OCR grâce à Tesseract. Vos PDF restent ainsi sélectionnables et recherchables après modification, à la différence des solutions qui vous renvoient des images aplaties.
En termes de fonctionnalités, il y a de nombreux atouts. Vous pouvez par exemple modifier plusieurs pages en une seule commande, créer de nouvelles diapositives qui respectent le style visuel de votre présentoir existant, et même utiliser des pages de référence pour que l’IA saisisse mieux votre charte graphique. Le traitement par lot est également géré en parallèle pour économiser du temps sur les grandes présentations.
L’installation se fait via pip avec
Et comme mentionné, vous aurez également besoin de Poppler pour le rendu PDF et de Tesseract pour l’OCR. Attention, un détail important, l’API Gemini Pro Image requiert un compte payant. Il faudra sortir le portefeuille car les clés gratuites ne permettent pas de générer des images… donc prévoyez quelques euros de crédit Google Cloud si vous souhaitez tester.
La fonctionnalité intéressante, c’est que par défaut, la résolution est en 4K, mais vous pouvez la réduire à 2K ou 1K pour économiser sur les coûts de l’API. Il existe aussi une option –use-context qui envoie tout le texte du PDF au modèle pour qu’il comprenne mieux le contexte de vos modifications. Et si vous créez une nouvelle diapositive, cette option est activée par défaut pour que le résultat soit cohérent avec le reste du document.
Voilà, si vous passez votre temps à modifier des présentations PDF et que vous en avez assez des processus interminables, installez Nano-PDF. C’est open source sous licence MIT, et cela change la vie !
Merci à Lorenper pour le partage !
Cet article peut contenir des images générées à l’aide de l’IA – J’apporte le plus grand soin à chaque article, toutefois, si vous repérez une erreur, faites-le moi savoir !
Points clés à retenir :
– Nano-PDF simplifie la modification des PDF en utilisant une approche basée sur le langage naturel.
– Il utilise des outils comme Poppler et Tesseract pour maintenir les fonctionnalités de sélection et de recherche des PDF.
– L’outil repose sur le modèle avancé Gemini 3 Pro Image de Google.
– Les modifications peuvent être effectuées en haute résolution avec des options pour réduire les coûts.
– Nécessite un compte payant pour utiliser pleinement l’API Gemini Pro Image.
– Open source sous licence MIT.
