Modelos personalizados en Smart Window - Trae tu propio endpoint

Firefox Firefox Actualizado por última vez: Hace 1 semana
This is a machine-generated translation of the English content. It has not been reviewed by a human, and may contain errors. If you would like to revise this content, you can start here.
Nota: La función Ventana Inteligente se pondrá a disposición de los usuarios de Firefox de forma gradual, empezando por los usuarios de Estados Unidos y Canadá en la versión de Firefox 150.

Ventana Inteligente te permite conectar tu propio modelo de IA en lugar de usar los proporcionados por Firefox. Esto es útil si quieres más control, usar un proveedor específico o ejecutar un modelo localmente en tu dispositivo.

Puedes conectar:

  • Un modelo remoto (como OpenRouter)
  • Un modelo local que se ejecute en tu dispositivo (como Lemonade Server u Ollama)
Nota: Si usas un modelo personalizado, es posible que Ventana Inteligente no funcione como se espera. Esta función y estas instrucciones están dirigidas a usuarios que están familiarizados con estos servicios y herramientas.

Usar un modelo remoto (OpenRouter)

  1. Crea una cuenta de OpenRouter si aún no tienes una, en https://openrouter.ai/.
  2. Genera una clave de API en OpenRouter y cópiala en un lugar seguro.
    • Las claves de API de OpenRouter comienzan con sk-or-v1-.
  3. Abre la página de modelos de OpenRouter y elige un modelo que te gustaría usar.
    • Toma nota de su ID de modelo. Ej: z-ai/glm-4.5-air:free.
  4. En Firefox: En la barra de menu, haz click en Firefox y selecciona Settings (o Preferences, en algunos casos).Haz click en el botón de menu Fx89menuButton y selecciona Ajustes, Configuración o Preferencias.
  5. Ve a AI Controls > Smart Window Settings > Assistant model.
  6. Selecciona Custom: Use your own LLM.
  7. Rellena los campos:
    • Nombre del modelo: Pega el ID del modelo de OpenRouter, del paso 3.
    • Punto de conexión del modelo con el punto de conexión de la API de OpenRouter, que suele ser https://openrouter.ai/api/v1.
    • Clave de API: Pega tu clave de API de OpenRouter del paso 2.
  8. Haz clic en Save.
  9. Abre una Ventana Inteligente y empieza a usar el Asistente.
Consejo: Puedes encontrar modelos gratuitos en OpenRouter buscando "free" en la página de modelos (enlace directo).
bringyourownmodel

Usar un modelo local

Ejemplo: Lemonade Server

  1. Descarga e instala Lemonade Server en https://lemonade-server.ai/. Debes usar la versión 10.2.0 o una más reciente.
  2. Ejecuta Lemonade Server y descarga un modelo de tu elección siguiendo las instrucciones de la aplicación.
  3. En un terminal de línea de comandos, establece un tamaño de contexto mayor usando el comando lemonade config set ctx_size=8192.
  4. Vuelve a cargar el modelo desde la interfaz de usuario o usando el comando lemonade unload (la próxima vez que hagas una solicitud al modelo, se cargará con tu configuración).
  5. En Firefox: En la barra de menu, haz click en Firefox y selecciona Settings (o Preferences, en algunos casos).Haz click en el botón de menu Fx89menuButton y selecciona Ajustes, Configuración o Preferencias.
  6. Ve a AI Controls > Smart Window Settings > Assistant model.
  7. Selecciona Custom: Use your own LLM.
  8. Rellena los campos:
    • Nombre del modelo: Introduce el nombre de tu modelo del paso 2 (por ejemplo, SmolLM3-3B-GGUF).
    • Punto de conexión del modelo: Introduce el punto de conexión de Lemonade Server, que suele ser http://localhost:13305/api/v1.
    • Ten en cuenta que no se requiere clave de API para Lemonade Server.
  9. Haz clic en Save.
  10. Abre una Ventana Inteligente y empieza a usar el Asistente.

Ejemplo: Ollama

  1. Descarga e instala Ollama en https://ollama.com/download.
  2. Ejecuta Ollama y sigue las instrucciones del sitio para descargar un modelo local de tu elección.
  3. Abre la pantalla de configuración de Firefox, ve a AI Controls > Smart Window Settings > Assistant model y selecciona Custom: Use your own LLM.
  4. Rellena los campos:
    • Nombre del modelo: Introduce el nombre de tu modelo del paso 2 (ej: qwen3.5:4b).
    • Punto de conexión del modelo: Introduce el punto de conexión de Ollama, que suele ser http://localhost:11434/v1.
    • Ten en cuenta que no se requiere clave de API para Ollama.
  5. Haz clic en Save.
  6. Abre una Ventana Inteligente y empieza a usar el Asistente.

Artículos relacionados

These fine people helped write this article:

Illustration of hands

Voluntario

Grow and share your expertise with others. Answer questions and improve our knowledge base.

Learn More