LLM Memory Calculator

Estimate GPU memory requirements for different large language model configurations

Model Configuration

System Type

Model Size

Precision/Quantization

Operation Mode

Memory Requirements

28

GB

Recommended Hardware

Requires 1× A100 (80GB) or 2× A100 (40GB)

Memory Blocks Visualization

Model

Framework

KV Cache

Activation

Buffer