boocode/apps/server/src/services/inference at a7a40c5b4653cea2c1f280b9b6398df880e9bea9 - boocode - Gitgaard

indifferentketchup/boocode

Files

History

indifferentketchup a8e475fdf4 perf(llama): unshadow cache-type + spec-decoding flags for agent opt-in

KV cache quantization (--cache-type-k q4_0) and ngram speculative decoding
(--spec-type ngram-mod) are high-value llama.cpp features that improve VRAM
usage and tokens/sec. Removing them from the shadowing lists allows agents
to enable them via llama_extra_args.

2026-06-07 22:40:23 +00:00

..

feat(server): add DCP clean-room context pruning

2026-06-07 17:57:39 +00:00

budget.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

content-flusher.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

error-handler.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

index.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

llama-args-validator.ts

perf(llama): unshadow cache-type + spec-decoding flags for agent opt-in

2026-06-07 22:40:23 +00:00

loop-detectors.ts

feat(server): add inference reliability - tool-shim and loop detectors

2026-06-07 17:57:58 +00:00

mistake-tracker.ts

feat: MistakeTracker + file-provenance ledger (v2.7.4)

2026-06-01 13:05:03 +00:00

parts.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

payload.ts

wip: context-meter + model-label UI and provider/inference tweaks

2026-06-03 14:55:38 +00:00

provider.ts

feat(web,server): inference settings UI with per-session inference overrides

2026-06-07 22:16:29 +00:00

prune.ts

v1.13.4: two-tier compaction prune — opencode pattern half-shipped in v1.11.0

2026-05-22 07:02:17 +00:00

sentinel-summaries.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

sentinels.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

step-decision.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

stream-error-classifier.ts

feat: post-review backlog hardening (cancel/parser/stall/history/9502)

2026-06-03 02:23:11 +00:00

stream-phase-adapter.ts

feat: post-review backlog hardening (cancel/parser/stall/history/9502)

2026-06-03 02:23:11 +00:00

stream-phase.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

tool-call-parser.ts

feat: post-review backlog hardening (cancel/parser/stall/history/9502)

2026-06-03 02:23:11 +00:00

tool-phase.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

tool-shim.ts

feat(server): add inference reliability - tool-shim and loop detectors

2026-06-07 17:57:58 +00:00

tool-suggestions.ts

v1.13.16-xml-parser: Anthropic <invoke> support + unknown-tool recovery hints

2026-05-22 20:59:25 +00:00

turn-config.ts

refactor: codebase audit cleanup — dead code, dedup, module splits

2026-06-02 21:12:29 +00:00

turn.ts

feat(server): add DCP clean-room context pruning

2026-06-07 17:57:39 +00:00

types.ts

feat(web,coder): arena pane — compare 2-6 AI competitors on same prompt

2026-06-06 23:25:29 +00:00