Name: Llama 4 Maverick 17B Instruct FP8 on NVIDIA NIM
Brand: AI at Meta
SKU: llama-4-maverick-17b-128e-instruct-fp8-nvidia-nim

Question 1

What is the context window for Llama 4 Maverick 17B Instruct FP8 on NVIDIA NIM?

Accepted Answer

Llama 4 Maverick 17B Instruct FP8 supports a 1m token context window on NVIDIA NIM.

Question 2

How does NVIDIA NIM compare to other Llama 4 Maverick 17B Instruct FP8 providers?

Accepted Answer

Llama 4 Maverick 17B Instruct FP8 is available from 11 providers. The cheapest input pricing is $0.15/1M tokens from OpenRouter.

Question 3

What API model ID do I use for Llama 4 Maverick 17B Instruct FP8 on NVIDIA NIM?

Accepted Answer

Use the model ID meta/llama-4-maverick-17b-128e-instruct when calling NVIDIA NIM's API.

Question 4

Who created Llama 4 Maverick 17B Instruct FP8?

Accepted Answer

Llama 4 Maverick 17B Instruct FP8 was created by AI at Meta as part of the Llama 4 model family.

Question 5

Is Llama 4 Maverick 17B Instruct FP8 open source?

Accepted Answer

Llama 4 Maverick 17B Instruct FP8 has open weights under Llama 4 Community according to the seed data, but that does not necessarily mean an OSI-approved open-source license.

Provider	Input (per 1M)	Output (per 1M)
Microsoft Foundry	$0.35	$1.41
Together AI	$0.27	$0.85
OpenRouter	$0.15	$0.60
Fireworks AI	—	—
DeepInfra	$0.15	$0.60

Type	Rate
GPU Hour Rate	$1.00/GPU·hr
GPU Config	1xH100

Llama 4 Maverick 17B Instruct FP8 on NVIDIA NIM

Why use Llama 4 Maverick 17B Instruct FP8 on NVIDIA NIM?

Setup recipe

Request example

Gotchas

Compare Llama 4 Maverick 17B Instruct FP8 Across Providers

Pricing

Capabilities

About Llama 4 Maverick 17B Instruct FP8

FAQ

Get Started

Model Specs

Other Providers(10)

Related Models on NVIDIA NIM

Provider