What context lengths do you support?

Last updated: July 9, 2025

Free Tier:

  • Llama3.3-70b: 64k

  • Llama4-Scout: 8k

  • Llama 3.1-8b: 8k

  • Qwen3 32b: 64k

  • Qwen3 235b: 40k

Paid Tiers:

  • Llama3.3-70b: 128k

  • Llama4-Scout: 32k

  • Deepseek R1 Distilled Llama 70b: 64k

  • Llama 3.1-8b: 8k

  • Qwen3 32b: 128k

  • Qwen3 235b: 128k