mirror of https://github.com/tcsenpai/agenticSeek.git synced 2025-06-01 16:50:10 +00:00

martin legrand ca2eea8089 update readme

2025-05-06 20:23:53 +02:00

19 KiB

Raw Permalink Blame History

AgenticSeek: Une IA comme Manus mais à base d'agents DeepSeek R1 fonctionnant en local.

Une alternative entièrement locale à Manus AI, un assistant IA qui code, explore votre système de fichiers, navigue sur le web et corrige ses erreurs, tout cela sans envoyer la moindre donnée dans le cloud. Cet agent autonome fonctionne entièrement sur votre hardware, garantissant la confidentialité de vos données.

🛠️ En cours de développement – On cherche activement des contributeurs!

https://github.com/user-attachments/assets/4bd5faf6-459f-4f94-bd1d-238c4b331469

Recherche sur le web des activités à faire à Paris

Code le jeu snake en python

J'aimerais que tu trouve une api météo et que tu me code une application qui affiche la météo à Toulouse

Fonctionnalités:

100% Local: Fonctionne en local sur votre PC. Vos données restent les vôtres.
Accès à vos Fichiers: Utilise bash pour naviguer et manipuler vos fichiers.
Codage semi-autonome: Peut écrire, déboguer et exécuter du code en Python, C, Golang et d'autres langages à venir.
Routage d'Agent: Sélectionne automatiquement l’agent approprié pour la tâche.
Planification: Pour les taches complexe utilise plusieurs agents.
Navigation Web Autonome: Navigation web autonome.
Memoire efficace: Gestion efficace de la mémoire et des sessions.

Installation

Assurez-vous d’avoir installé le pilote Chrome, Docker et Python 3.10.

Nous vous conseillons fortement d'utiliser exactement Python 3.10 pour l'installation. Des erreurs de dépendances pourraient survenir autrement.

Pour les problèmes liés au pilote Chrome, consultez la section Chromedriver.

1️⃣ Cloner le repo et configurer

git clone https://github.com/Fosowl/agenticSeek.git
cd agenticSeek
mv .env.example .env

2 Créer un environnement virtuel

python3 -m venv agentic_seek_env
source agentic_seek_env/bin/activate     
# Sur Windows: agentic_seek_env\Scripts\activate

3️⃣ Installation

Automatique:

./install.sh

Manuel:

Note : Pour tous les systèmes d'exploitation, assurez-vous que le ChromeDriver que vous installez correspond à la version de Chrome installée. Exécutez google-chrome --version. Consultez les problèmes connus si vous avez Chrome >135

Linux:

Mettre à jour la liste des paquets : sudo apt update

Installer les dépendances : sudo apt install -y alsa-utils portaudio19-dev python3-pyaudio libgtk-3-dev libnotify-dev libgconf-2-4 libnss3 libxss1

Installer ChromeDriver correspondant à la version de votre navigateur Chrome : sudo apt install -y chromium-chromedriver

Installer les prérequis : pip3 install -r requirements.txt

macOS:

Mettre à jour brew : brew update

Installer chromedriver : brew install --cask chromedriver

Installer portaudio : brew install portaudio

Mettre à jour pip : python3 -m pip install --upgrade pip

Mettre à jour wheel : pip3 install --upgrade setuptools wheel

Installer les prérequis : pip3 install -r requirements.txt

Windows:

Installer pyreadline3 : pip install pyreadline3

Installer portaudio manuellement (par exemple, via vcpkg ou des binaires précompilés) puis exécutez : pip install pyaudio

Télécharger et installer chromedriver manuellement depuis : https://sites.google.com/chromium.org/driver/getting-started

Placez chromedriver dans un répertoire inclus dans votre PATH.

Installer les prérequis : pip3 install -r requirements.txt

Faire fonctionner sur votre machine

Nous recommandons d’utiliser au minimum DeepSeek 14B, les modèles plus petits ont du mal avec l’utilisation des outils et oublient rapidement le contexte.

Lancer votre provider local, par exemple avec ollama:

ollama serve

Configurer le config.ini

Modifiez le fichier config.ini pour définir provider_name sur un fournisseur supporté et provider_model sur un LLM compatible avec votre fournisseur. Nous recommandons des modèles de raisonnement comme Qwen ou Deepseek.

Consultez la section FAQ à la fin du README pour connaître le matériel requis.

[MAIN]
is_local = True # Si vous exécutez localement ou avec un fournisseur distant.
provider_name = ollama # ou lm-studio, openai, etc..
provider_model = deepseek-r1:14b # choisissez un modèle adapté à votre matériel
provider_server_address = 127.0.0.1:11434
agent_name = Jarvis # nom de votre IA
recover_last_session = True # récupérer ou non la session précédente
save_session = True # mémoriser ou non la session actuelle
speak = True # synthèse vocale
listen = False # reconnaissance vocale, uniquement pour CLI
work_dir =  /Users/mlg/Documents/workspace # L'espace de travail pour AgenticSeek.
jarvis_personality = False # Utiliser une personnalité plus "Jarvis", non recommandé avec des petits modèles
languages = en fr # Liste des langages, la synthèse vocale utilisera par défaut la première langue de la liste
[BROWSER]
headless_browser = True # Utiliser ou non le navigateur sans interface graphique, recommandé uniquement avec l'interface web.
stealth_mode = True # Utiliser selenium non détectable pour réduire la détection du navigateur

Remarque : Certains fournisseurs (ex : lm-studio) nécessitent http:// devant l'adresse IP. Par exemple http://127.0.0.1:1234

Liste des provideurs locaux

Fournisseur	Local ?	Description
ollama	Oui	Exécutez des LLM localement avec facilité en utilisant ollama comme fournisseur LLM
lm-studio	Oui	Exécutez un LLM localement avec LM studio (définissez `provider_name` sur `lm-studio`)
openai	Oui	Utilisez une API local compatible avec openai

Démarrer les services & Exécuter

Activez votre environnement Python si nécessaire.

source agentic_seek_env/bin/activate

Démarrez les services requis. Cela lancera tous les services définis dans le fichier docker-compose.yml, y compris : - searxng - redis (nécessaire pour searxng) - frontend

sudo ./start_services.sh # MacOS
start ./start_services.cmd # Windows

Option 1 : Exécuter avec l'interface CLI.

python3 cli.py

Option 2 : Exécuter avec l'interface Web.

Démarrez le backend.

python3 api.py

Allez sur http://localhost:3000/ et vous devriez voir l'interface web.

Veuillez noter que l'interface web ne diffuse pas les messages en continu pour le moment.

Voyez la section Utilisation si vous ne comprenez pas comment l’utiliser

Voyez la section Problèmes connus si vous rencontrez des problèmes

Voyez la section Exécuter avec une API si votre matériel ne peut pas exécuter DeepSeek localement

Voyez la section Configuration pour une explication détaillée du fichier de configuration.

Utilisation

Assurez-vous que les services sont en cours d’exécution avec ./start_services.sh et lancez AgenticSeek avec le CLI ou l'interface Web.

CLI: Vous verrez un prompt : ">>> "
Cela indique qu’AgenticSeek attend que vous saisissiez des instructions.
Vous pouvez également utiliser la reconnaissance vocale en définissant listen = True dans la configuration.
Pour quitter, dites simplement goodbye.

Interface:

Assurez-vous d'avoir bien démarré le backend avec python3 api.py.
Allez sur localhost:3000 où vous verrez une interface web.
Tapez simplement votre message et patientez.
Si vous n'avez pas d'interface sur localhost:3000, c'est que vous n'avez pas démarré les services avec start_services.sh.

Voici quelques exemples d’utilisation :

Programmation

Aide-moi avec la multiplication de matrices en Golang

Initalize un nouveau project python, setup le readme, gitignore etc.. et fait un premier commit

Fais un jeu snake en Python

Recherche web

Fais une recherche sur le web pour trouver des startups technologiques au Japon qui travaillent sur des recherches avancées en IA

Peux-tu trouver sur internet qui a créé agenticSeek ?

Peux-tu trouver sur quel site je peux acheter une RTX 4090 à bas prix ?

Fichier

Hé, peux-tu trouver où est contrat.pdf ? Je l’ai perdu

Montre-moi combien d’espace il me reste sur mon disque

Trouve et lis le fichier README.md et suis les instructions d’installation

Conversation

Parle-moi de la France

Quel est le sens de la vie ?

Donne moi une recette simple pour ce midi j'ai pas d'inspi

Après avoir saisi votre requête, AgenticSeek attribuera le meilleur agent pour la tâche.

Le système de routage des agents peut parfois ne pas toujours attribuer le bon agent en fonction de votre requête.

Par conséquent, vous devez être assez explicite sur ce que vous voulez et sur la manière dont l’IA doit procéder. Par exemple, si vous voulez qu’elle effectue une recherche sur le web, ne dites pas :

Connait-tu de bons pays pour voyager seul ?

Dites plutôt :

Fait une recherche sur le web, quels sont les meilleurs pays pour voyager seul?

Exécuter le LLM sur votre propre serveur

Si vous disposez d’un ordinateur puissant ou d’un serveur que vous voulez utiliser, mais que vous souhaitez y accéder depuis votre ordinateur portable, vous avez la possibilité d’exécuter le LLM sur un serveur distant.

1️⃣ Configurer et démarrer les scripts du serveur

Sur votre "serveur" qui exécutera le modèle IA, obtenez l’adresse IP

ip a | grep "inet " | grep -v 127.0.0.1 | awk '{print $2}' | cut -d/ -f1

Remarque : Pour Windows ou macOS, utilisez respectivement ipconfig ou ifconfig pour trouver l’adresse IP.

Clonez le dépôt et entrez dans le dossier server/.

git clone --depth 1 https://github.com/Fosowl/agenticSeek.git
cd agenticSeek/server/

Installez les dépendances spécifiques au serveur :

pip3 install -r requirements.txt

Exécutez le script du serveur.

python3 app.py --provider ollama --port 3333

Vous avez le choix entre utiliser ollama et llamacpp comme service LLM.

2️⃣ Lancer

Maintenant, sur votre ordinateur personnel :

Modifiez le fichier config.ini pour définir provider_name sur server et provider_model sur deepseek-r1:14b.

Définissez provider_server_address sur l’adresse IP de la machine qui exécutera le modèle.

[MAIN]
is_local = False
provider_name = server
provider_model = deepseek-r1:14b
provider_server_address = x.x.x.x:3333

Ensuite, exécutez avec le CLI ou l'interface graphique comme expliqué dans la section pour les fournisseurs locaux.

Exécuter avec une API externe

AVERTISSEMENT : Assurez-vous qu’il n’y a pas d’espace en fin de ligne dans la configuration.

[MAIN]
is_local = False
provider_name = openai
provider_model = gpt-4o
provider_server_address = 127.0.0.1:5000 # n'importe pas

Liste de provideurs API

Fournisseur	Local ?	Description
openai	Non	Utilise l'API ChatGPT
deepseek-api	Non	API Deepseek (non privé)
huggingface	Non	API Hugging-Face (non privé)
togetherAI	Non	Utilise l'API Together AI (non privé)
google	Non	Utilise l'API Google Gemini (non privé)

Ensuite, exécutez avec le CLI ou l'interface graphique comme expliqué dans la section pour les fournisseurs locaux.

Config

Exemple de configuration :

[MAIN]
is_local = True
provider_name = ollama
provider_model = deepseek-r1:1.5b
provider_server_address = 127.0.0.1:11434
agent_name = Friday
recover_last_session = False
save_session = False
speak = False
listen = False
work_dir =  /Users/mlg/Documents/ai_folder
jarvis_personality = False
languages = en fr
[BROWSER]
headless_browser = False
stealth_mode = False

Explication du fichier config.ini:

is_local -> Exécute l’agent localement (True) ou sur un serveur distant (False).

provider_name -> Le fournisseur à utiliser (parmi : ollama, server, lm-studio, deepseek-api).

provider_model -> Le modèle utilisé, par exemple, deepseek-r1:1.5b.

provider_server_address -> Adresse du serveur, par exemple, 127.0.0.1:11434 pour local. Définissez n’importe quoi pour une API non locale.

agent_name -> Nom de l’agent, par exemple, Friday. Utilisé comme mot déclencheur pour la reconnaissance vocale.

recover_last_session -> Reprend la dernière session (True) ou non (False).

save_session -> Sauvegarde les données de la session (True) ou non (False).

speak -> Active la sortie vocale (True) ou non (False).

listen -> Écoute les entrées vocales (True) ou non (False).

work_dir -> Dossier auquel l’IA aura accès, par exemple : /Users/user/Documents/.

jarvis_personality -> Utilise une personnalité inspiré de Jarvis (True) ou non (False). Cela utilise simplement une prompt alternative. Marche moins bien en français.

headless_browser -> Exécute le navigateur sans fenêtre visible (True) ou non (False).

stealth_mode -> Rend la détection des bots plus difficile. Le seul inconvénient est que vous devez installer manuellement l’extension anticaptcha.

languages -> La liste de languages supportés (nécessaire pour le routage d'agents). Plus la liste est longue. Plus un nombre important de modèles sera téléchargés.

Providers

Le tableau ci-dessous montre les LLM providers disponibles :

Provider	Local?	Description
ollama	Yes	Exécutez des LLM localement avec facilité en utilisant Ollama comme fournisseur LLM
server	Yes	Hébergez le modèle sur une autre machine, exécutez sur votre machine locale
lm-studio	Yes	Exécutez un LLM localement avec LM Studio (définissez provider_name sur lm-studio)
openai	No	Utilise l'API ChatGPT (pas privé)
deepseek-api	No	Utilise l'API Deepseek (pas privé)
huggingface	No	Utilise Hugging-Face (pas privé)
together	No	Utilise l'api Together AI

Pour sélectionner un provider LLM, modifiez le config.ini :

is_local = False
provider_name = openai
provider_model = gpt-4o
provider_server_address = 127.0.0.1:5000

is_local : doit être True pour tout LLM exécuté localement, sinon False.

provider_name : Sélectionnez le fournisseur à utiliser par son nom, voir la liste des fournisseurs ci-dessus.

provider_model : Définissez le modèle à utiliser par l’agent.

provider_server_address : peut être défini sur n’importe quoi si vous n’utilisez pas le fournisseur server.

Problèmes connus

Problèmes avec Chromedriver

Erreur #1:incompatibilité

Exception: Failed to initialize browser: Message: session not created: This version of ChromeDriver only supports Chrome version 113 Current browser version is 134.0.6998.89 with binary path

Cela se produit s’il y a une incompatibilité entre votre navigateur et la version de chromedriver.

Vous devez naviguer pour télécharger la dernière version :

https://developer.chrome.com/docs/chromedriver/downloads

Si vous utilisez Chrome version 115 ou plus récent, allez sur :

https://googlechromelabs.github.io/chrome-for-testing/

Et téléchargez la version de chromedriver correspondant à votre système d’exploitation.

Si cette section est incomplète, merci de faire une nouvelle issue sur github.

FAQ

Q: Quel matériel est nécessaire ?

Taille du Modèle	GPU	Commentaire
7B	8 Go VRAM	⚠️ Non recommandé. Performances médiocres, hallucinations fréquentes, et l'agent planificateur échouera probablement.
14B	12 Go VRAM (par ex. RTX 3060)	✅ Utilisable pour des tâches simples. Peut rencontrer des difficultés avec la navigation web et les tâches de planification.
32B	24+ Go VRAM (par ex. RTX 4090)	🚀 Réussite avec la plupart des tâches, peut encore avoir des difficultés avec la planification des tâches.
70B+	48+ Go VRAM (par ex. Mac Studio)	💪 Excellent. Recommandé pour des cas d'utilisation avancés.

Q: Pourquoi deepseek et pas un autre modèle

DeepSeek R1 excelle dans le raisonnement et l’utilisation d’outils pour sa taille. Nous pensons que c’est un choix solide pour nos besoins, bien que d’autres modèles fonctionnent également (bien que moins bien pour un nombre équivalent de paramètres).

Q: J'ai une erreur quand je lance le programme, je fait quoi?

Assurez-vous qu’Ollama est en cours d’exécution (ollama serve), que votre config.ini correspond à votre fournisseur, et que les dépendances sont installées. Si cela ne fonctionne pas, n’hésitez pas à signaler un problème.

Q: C'est vraiment 100% local?

Oui, avec les fournisseurs Ollama, lm-studio ou Server, toute la reconnaissance vocale, le LLM et la synthèse vocale fonctionnent localement. Les options non locales (OpenAI ou autres API) sont facultatives.

Q: En quoi c'est supérieur à Manus

Il ne l'est certainement pas, mais nous privilégions l’exécution locale et la confidentialité par rapport à une approche basée sur le cloud. C’est une alternative plus accessible et surtout moins cher !

Contribution

Nous recherchons des développeurs pour améliorer AgenticSeek ! Consultez la section "issues" github ou les discussions.

Guide du contributeur

Mainteneurs:

Fosowl steveh8758 https://github.com/antoineVIVIES

19 KiB Raw Permalink Blame History Unescape Escape

AgenticSeek: Une IA comme Manus mais à base d'agents DeepSeek R1 fonctionnant en local.

Fonctionnalités:

Installation

1️⃣ Cloner le repo et configurer

2 Créer un environnement virtuel

3️⃣ Installation

Faire fonctionner sur votre machine

Démarrer les services & Exécuter

Utilisation

Programmation

Recherche web

Fichier

Conversation

Exécuter le LLM sur votre propre serveur

1️⃣ Configurer et démarrer les scripts du serveur

2️⃣ Lancer

Exécuter avec une API externe

Config

Providers

Problèmes connus

Problèmes avec Chromedriver

FAQ

Contribution

Mainteneurs:

19 KiB

Raw Permalink Blame History