fix : server problem with llamacpp

2025-06-06 19:15:28 +00:00 · 2025-03-29 13:31:13 +01:00 · 2025-03-29 13:31:13 +01:00 · 44e0508ae5
commit 44e0508ae5
parent 4676b817e9
1 changed files with 7 additions and 5 deletions
--- a/server/sources/llamacpp.py
+++ b/server/sources/llamacpp.py
@ -9,13 +9,15 @@ class LlamacppLLM(GeneratorLLM):
        Handle generation using llama.cpp
        """
        super().__init__()
-        self.llm = Llama.from_pretrained(
+        self.llm = None
            repo_id=self.model,
            filename="*q8_0.gguf",
            verbose=True
        )
    def generate(self, history):
        if self.model is None:
            self.llm = Llama.from_pretrained(
                repo_id=self.model,
                filename="*q8_0.gguf",
                verbose=True
            )
        self.logger.info(f"Using {self.model} for generation with Llama.cpp")
        self.llm.create_chat_completion(
              messages = history