fix : response timeout

2025-07-24 10:20:13 +00:00 · 2025-03-29 14:30:28 +01:00 · 2025-03-29 14:30:28 +01:00 · f42a31578e
commit f42a31578e
parent 90894f806a
2 changed files with 14 additions and 4 deletions
--- a/server/sources/llamacpp.py
+++ b/server/sources/llamacpp.py
@ -20,6 +20,17 @@ class LlamacppLLM(GeneratorLLM):
            )
            return
        self.logger.info(f"Using {self.model} for generation with Llama.cpp")
-        self.llm.create_chat_completion(
-              messages = history
-        )
+        try:
+            with self.state.lock:
+                self.state.is_generating = True
+                self.state.last_complete_sentence = ""
+                self.state.current_buffer = ""
+            output = self.llm.create_chat_completion(
+                  messages = history
+            )
+            self.state.current_buffer = output
+        except Exception as e:
+            self.logger.error(f"Error: {e}")
+        finally:
+            with self.state.lock:
+                self.state.is_generating = False
--- a/server/sources/ollama.py
+++ b/server/sources/ollama.py
@ -18,7 +18,6 @@ class OllamaLLM(GeneratorLLM):
                self.state.last_complete_sentence = ""
                self.state.current_buffer = ""

-            self.logger.info("Starting generation...")
            stream = ollama.chat(
                model=self.model,
                messages=history,