boocode/apps/server/src/services/inference/provider.ts

import { createOpenAICompatible } from '@ai-sdk/openai-compatible';
import type { LanguageModel } from 'ai';

// v1.13.1-A: AI SDK provider against llama-swap. baseURL is threaded from
// config.LLAMA_SWAP_URL at call time (not module-load) so tests can stub the
// upstream without touching env vars. No apiKey — llama-swap is unauth in our
// Tailscale topology and exposing it over the public internet is gated by
// Authelia at the Caddy layer, not by API keys.

const cache = new Map<string, ReturnType<typeof createOpenAICompatible>>();

function getProvider(baseURL: string): ReturnType<typeof createOpenAICompatible> {
  let provider = cache.get(baseURL);
  if (!provider) {
    provider = createOpenAICompatible({
      name: 'llama-swap',
      baseURL: baseURL.endsWith('/v1') ? baseURL : `${baseURL}/v1`,
    });
    cache.set(baseURL, provider);
  }
  return provider;
}

export function upstreamModel(baseURL: string, modelId: string): LanguageModel {
  return getProvider(baseURL).chatModel(modelId);
}