From 45a6acf77ea2cf0e388f037441cd0297201566fd Mon Sep 17 00:00:00 2001
From: Claudomator Agent <agent@claudomator>
Date: Mon, 9 Mar 2026 07:37:53 +0000
Subject: executor: log errors from all unchecked
 UpdateTaskState/UpdateTaskQuestion calls

All previously ignored errors from p.store.UpdateTaskState() and
p.store.UpdateTaskQuestion() in execute() and executeResume() now log
with structured context (taskID, state, error).

Introduces a Store interface so tests can inject a failing mock store.
Adds TestPool_UpdateTaskState_DBError_IsLoggedAndResultDelivered to
verify that a DB write failure is logged and the result is still
delivered to resultCh.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
---
 internal/executor/executor.go      | 88 +++++++++++++++++++++++++++++---------
 internal/executor/executor_test.go | 76 ++++++++++++++++++++++++++++++++
 2 files changed, 144 insertions(+), 20 deletions(-)

(limited to 'internal')

diff --git a/internal/executor/executor.go b/internal/executor/executor.go
index 4bb1f2c..baeb399 100644
--- a/internal/executor/executor.go
+++ b/internal/executor/executor.go
@@ -15,6 +15,18 @@ import (
 	"github.com/google/uuid"
 )
 
+// Store is the subset of storage.DB methods used by the Pool.
+// Defining it as an interface allows test doubles to be injected.
+type Store interface {
+	GetTask(id string) (*task.Task, error)
+	ListTasks(filter storage.TaskFilter) ([]*task.Task, error)
+	ListExecutions(taskID string) ([]*storage.Execution, error)
+	CreateExecution(e *storage.Execution) error
+	UpdateExecution(e *storage.Execution) error
+	UpdateTaskState(id string, newState task.State) error
+	UpdateTaskQuestion(taskID, questionJSON string) error
+}
+
 // LogPather is an optional interface runners can implement to provide the log
 // directory for an execution before it starts. The pool uses this to persist
 // log paths at CreateExecution time rather than waiting until execution ends.
@@ -38,7 +50,7 @@ type workItem struct {
 type Pool struct {
 	maxConcurrent   int
 	runners         map[string]Runner
-	store           *storage.DB
+	store           Store
 	logger          *slog.Logger
 	depPollInterval time.Duration // how often waitForDependencies polls; defaults to 5s
 
@@ -61,7 +73,7 @@ type Result struct {
 	Err       error
 }
 
-func NewPool(maxConcurrent int, runners map[string]Runner, store *storage.DB, logger *slog.Logger) *Pool {
+func NewPool(maxConcurrent int, runners map[string]Runner, store Store, logger *slog.Logger) *Pool {
 	if maxConcurrent < 1 {
 		maxConcurrent = 1
 	}
@@ -252,32 +264,48 @@ func (p *Pool) executeResume(ctx context.Context, t *task.Task, exec *storage.Ex
 		var blockedErr *BlockedError
 		if errors.As(err, &blockedErr) {
 			exec.Status = "BLOCKED"
-			p.store.UpdateTaskState(t.ID, task.StateBlocked)
-			p.store.UpdateTaskQuestion(t.ID, blockedErr.QuestionJSON)
+			if err := p.store.UpdateTaskState(t.ID, task.StateBlocked); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateBlocked, "error", err)
+			}
+			if err := p.store.UpdateTaskQuestion(t.ID, blockedErr.QuestionJSON); err != nil {
+				p.logger.Error("failed to update task question", "taskID", t.ID, "error", err)
+			}
 		} else if ctx.Err() == context.DeadlineExceeded {
 			exec.Status = "TIMED_OUT"
 			exec.ErrorMsg = "execution timed out"
-			p.store.UpdateTaskState(t.ID, task.StateTimedOut)
+			if err := p.store.UpdateTaskState(t.ID, task.StateTimedOut); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateTimedOut, "error", err)
+			}
 		} else if ctx.Err() == context.Canceled {
 			exec.Status = "CANCELLED"
 			exec.ErrorMsg = "execution cancelled"
-			p.store.UpdateTaskState(t.ID, task.StateCancelled)
+			if err := p.store.UpdateTaskState(t.ID, task.StateCancelled); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateCancelled, "error", err)
+			}
 		} else if isQuotaExhausted(err) {
 			exec.Status = "BUDGET_EXCEEDED"
 			exec.ErrorMsg = err.Error()
-			p.store.UpdateTaskState(t.ID, task.StateBudgetExceeded)
+			if err := p.store.UpdateTaskState(t.ID, task.StateBudgetExceeded); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateBudgetExceeded, "error", err)
+			}
 		} else {
 			exec.Status = "FAILED"
 			exec.ErrorMsg = err.Error()
-			p.store.UpdateTaskState(t.ID, task.StateFailed)
+			if err := p.store.UpdateTaskState(t.ID, task.StateFailed); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateFailed, "error", err)
+			}
 		}
 	} else {
 		if t.ParentTaskID == "" {
 			exec.Status = "READY"
-			p.store.UpdateTaskState(t.ID, task.StateReady)
+			if err := p.store.UpdateTaskState(t.ID, task.StateReady); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateReady, "error", err)
+			}
 		} else {
 			exec.Status = "COMPLETED"
-			p.store.UpdateTaskState(t.ID, task.StateCompleted)
+			if err := p.store.UpdateTaskState(t.ID, task.StateCompleted); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateCompleted, "error", err)
+			}
 		}
 	}
 
@@ -371,7 +399,9 @@ func (p *Pool) execute(ctx context.Context, t *task.Task) {
 		if createErr := p.store.CreateExecution(exec); createErr != nil {
 			p.logger.Error("failed to create execution record", "error", createErr)
 		}
-		p.store.UpdateTaskState(t.ID, task.StateFailed)
+		if err := p.store.UpdateTaskState(t.ID, task.StateFailed); err != nil {
+			p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateFailed, "error", err)
+		}
 		p.resultCh <- &Result{TaskID: t.ID, Execution: exec, Err: err}
 		return
 	}
@@ -391,7 +421,9 @@ func (p *Pool) execute(ctx context.Context, t *task.Task) {
 			if createErr := p.store.CreateExecution(exec); createErr != nil {
 				p.logger.Error("failed to create execution record", "error", createErr)
 			}
-			p.store.UpdateTaskState(t.ID, task.StateFailed)
+			if err := p.store.UpdateTaskState(t.ID, task.StateFailed); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateFailed, "error", err)
+			}
 			p.resultCh <- &Result{TaskID: t.ID, Execution: exec, Err: err}
 			return
 		}
@@ -467,32 +499,48 @@ func (p *Pool) execute(ctx context.Context, t *task.Task) {
 		var blockedErr *BlockedError
 		if errors.As(err, &blockedErr) {
 			exec.Status = "BLOCKED"
-			p.store.UpdateTaskState(t.ID, task.StateBlocked)
-			p.store.UpdateTaskQuestion(t.ID, blockedErr.QuestionJSON)
+			if err := p.store.UpdateTaskState(t.ID, task.StateBlocked); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateBlocked, "error", err)
+			}
+			if err := p.store.UpdateTaskQuestion(t.ID, blockedErr.QuestionJSON); err != nil {
+				p.logger.Error("failed to update task question", "taskID", t.ID, "error", err)
+			}
 		} else if ctx.Err() == context.DeadlineExceeded {
 			exec.Status = "TIMED_OUT"
 			exec.ErrorMsg = "execution timed out"
-			p.store.UpdateTaskState(t.ID, task.StateTimedOut)
+			if err := p.store.UpdateTaskState(t.ID, task.StateTimedOut); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateTimedOut, "error", err)
+			}
 		} else if ctx.Err() == context.Canceled {
 			exec.Status = "CANCELLED"
 			exec.ErrorMsg = "execution cancelled"
-			p.store.UpdateTaskState(t.ID, task.StateCancelled)
+			if err := p.store.UpdateTaskState(t.ID, task.StateCancelled); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateCancelled, "error", err)
+			}
 		} else if isQuotaExhausted(err) {
 			exec.Status = "BUDGET_EXCEEDED"
 			exec.ErrorMsg = err.Error()
-			p.store.UpdateTaskState(t.ID, task.StateBudgetExceeded)
+			if err := p.store.UpdateTaskState(t.ID, task.StateBudgetExceeded); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateBudgetExceeded, "error", err)
+			}
 		} else {
 			exec.Status = "FAILED"
 			exec.ErrorMsg = err.Error()
-			p.store.UpdateTaskState(t.ID, task.StateFailed)
+			if err := p.store.UpdateTaskState(t.ID, task.StateFailed); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateFailed, "error", err)
+			}
 		}
 	} else {
 		if t.ParentTaskID == "" {
 			exec.Status = "READY"
-			p.store.UpdateTaskState(t.ID, task.StateReady)
+			if err := p.store.UpdateTaskState(t.ID, task.StateReady); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateReady, "error", err)
+			}
 		} else {
 			exec.Status = "COMPLETED"
-			p.store.UpdateTaskState(t.ID, task.StateCompleted)
+			if err := p.store.UpdateTaskState(t.ID, task.StateCompleted); err != nil {
+				p.logger.Error("failed to update task state", "taskID", t.ID, "state", task.StateCompleted, "error", err)
+			}
 		}
 	}
 
diff --git a/internal/executor/executor_test.go b/internal/executor/executor_test.go
index c0f6d66..1adba7e 100644
--- a/internal/executor/executor_test.go
+++ b/internal/executor/executor_test.go
@@ -15,6 +15,43 @@ import (
 	"github.com/thepeterstone/claudomator/internal/task"
 )
 
+// capturingHandler is a slog.Handler that records log records for assertions.
+type capturingHandler struct {
+	mu      sync.Mutex
+	records []slog.Record
+}
+
+func (h *capturingHandler) Enabled(_ context.Context, _ slog.Level) bool { return true }
+func (h *capturingHandler) Handle(_ context.Context, r slog.Record) error {
+	h.mu.Lock()
+	defer h.mu.Unlock()
+	h.records = append(h.records, r)
+	return nil
+}
+func (h *capturingHandler) WithAttrs(attrs []slog.Attr) slog.Handler { return h }
+func (h *capturingHandler) WithGroup(name string) slog.Handler       { return h }
+
+func (h *capturingHandler) hasMessageContaining(substr string) bool {
+	h.mu.Lock()
+	defer h.mu.Unlock()
+	for _, r := range h.records {
+		if strings.Contains(r.Message, substr) {
+			return true
+		}
+	}
+	return false
+}
+
+// failingStore wraps a real DB but returns an error for UpdateTaskState calls.
+type failingStore struct {
+	*storage.DB
+	updateStateErr error
+}
+
+func (f *failingStore) UpdateTaskState(id string, newState task.State) error {
+	return f.updateStateErr
+}
+
 // mockRunner implements Runner for testing.
 type mockRunner struct {
 	mu       sync.Mutex
@@ -156,6 +193,45 @@ func TestPool_Submit_Failure(t *testing.T) {
 	}
 }
 
+// TestPool_UpdateTaskState_DBError_IsLoggedAndResultDelivered verifies that
+// when UpdateTaskState returns an error, the error is logged with structured
+// context (taskID, state) and the execution result is still sent to resultCh.
+func TestPool_UpdateTaskState_DBError_IsLoggedAndResultDelivered(t *testing.T) {
+	db := testStore(t)
+	store := &failingStore{DB: db, updateStateErr: fmt.Errorf("db write failed")}
+
+	handler := &capturingHandler{}
+	logger := slog.New(handler)
+
+	runner := &mockRunner{err: fmt.Errorf("runner error")}
+	runners := map[string]Runner{"claude": runner}
+	pool := NewPool(2, runners, store, logger)
+
+	tk := makeTask("dberr-1")
+	db.CreateTask(tk)
+
+	if err := pool.Submit(context.Background(), tk); err != nil {
+		t.Fatalf("submit: %v", err)
+	}
+
+	select {
+	case result := <-pool.Results():
+		// Result must still arrive despite the DB error.
+		if result == nil {
+			t.Fatal("expected non-nil result")
+		}
+		if result.TaskID != tk.ID {
+			t.Errorf("taskID: want %q, got %q", tk.ID, result.TaskID)
+		}
+	case <-time.After(5 * time.Second):
+		t.Fatal("timed out waiting for result — result not delivered despite DB error")
+	}
+
+	if !handler.hasMessageContaining("failed to update task state") {
+		t.Error("expected 'failed to update task state' log entry, but none found")
+	}
+}
+
 func TestPool_Submit_Timeout(t *testing.T) {
 	store := testStore(t)
 	runner := &mockRunner{delay: 5 * time.Second}
-- 
cgit v1.2.3