Google🧠 DENSE
Gemma 3 4B
4B
ПАРАМЕТРЫ
3 ГБ
МИН._VRAM (Q4)
8 ГБ
МИН._VRAM (FP16)
128K
КОНТЕКСТ
💵 ЦЕНЫ_API (OPENROUTER)
ВХОД: $0.07/1M ток.ВЫХОД: $0.30/1M ток.
🖥 СОВМЕСТИМЫЕ_GPU (44)
GPU с ≥3 ГБ VRAM для запуска Gemma 3 4B в квантизации Q4_K_M
| GPU | VRAM | BANDWIDTH | TOK/S | ЦЕНА (НОВАЯ) | $/TOK/S |
|---|---|---|---|---|---|
| GB200 NVL 384GBNVIDIA | 384 ГБ | 16000 ГБ/с | 2000.0 | $70,000 | $35 |
| B200 192GBNVIDIA | 192 ГБ | 8000 ГБ/с | 1100.0 | $40,000 | $36 |
| B100 192GBNVIDIA | 192 ГБ | 8000 ГБ/с | 850.0 | $35,000 | $41 |
| Gaudi 3 128GBIntel | 128 ГБ | 3700 ГБ/с | 552.3 | $15,000 | $27 |
| MI300X 192GBAMD | 192 ГБ | 5300 ГБ/с | 550.0 | $15,000 | $27 |
| H100 SXM 80GBNVIDIA | 80 ГБ | 3350 ГБ/с | 500.0 | $30,000 | $60 |
| H200 SXM 141GBNVIDIA | 141 ГБ | 4800 ГБ/с | 498.0 | $30,000 | $60 |
| MI250X 128GBAMD | 128 ГБ | 3200 ГБ/с | 477.5 | $12,000 | $25 |
| H200 PCIe 141GBNVIDIA | 141 ГБ | 4800 ГБ/с | 448.3 | $28,000 | $62 |
| H100 PCIe 80GBNVIDIA | 80 ГБ | 2039 ГБ/с | 425.0 | $25,000 | $59 |
| A100 80GBNVIDIA | 80 ГБ | 2039 ГБ/с | 325.0 | $15,000 | $46 |
| RTX 5090 32GBNVIDIA | 32 ГБ | 1792 ГБ/с | 300.0 | $1,999 | $7 |
| Ascend 910C 128GBHuawei | 128 ГБ | 1600 ГБ/с | 300.0 | $15,000 | $50 |
| A100 40GBNVIDIA | 40 ГБ | 1555 ГБ/с | 275.0 | $10,000 | $36 |
| RTX 6000 Ada 48GBNVIDIA | 48 ГБ | 960 ГБ/с | 261.3 | $6,500 | $25 |
| Biren BR100 64GBBiren | 64 ГБ | 1024 ГБ/с | 250.0 | $12,000 | $48 |
| RTX 4090 24GBNVIDIA | 24 ГБ | 1008 ГБ/с | 237.5 | $1,600 | $7 |
| RTX 5070 Ti 16GBNVIDIA | 16 ГБ | 896 ГБ/с | 233.3 | $749 | $3 |
| L40S 48GBNVIDIA | 48 ГБ | 864 ГБ/с | 225.0 | $8,000 | $36 |
| L40 48GBNVIDIA | 48 ГБ | 864 ГБ/с | 225.0 | $6,500 | $29 |
| Ascend 910B 64GBHuawei | 64 ГБ | 1200 ГБ/с | 200.0 | $10,000 | $50 |
| Atlas 300T A2 64GBHuawei | 64 ГБ | 1200 ГБ/с | 200.0 | $8,000 | $40 |
| RX 7900 XT 20GBAMD | 20 ГБ | 800 ГБ/с | 190.3 | $799 | $4 |
| Mac M2 UltraApple | 192 ГБ | 800 ГБ/с | 190.3 | $7,000 | $37 |
| Mac M3 Ultra 192GBApple | 192 ГБ | 800 ГБ/с | 190.3 | $6,999 | $37 |
| RTX 4080 SUPER 16GBNVIDIA | 16 ГБ | 736 ГБ/с | 175.0 | $999 | $6 |
| RTX 4080 16GBNVIDIA | 16 ГБ | 717 ГБ/с | 170.5 | $1,000 | $6 |
| RTX 5080 16GBNVIDIA | 16 ГБ | 960 ГБ/с | 166.8 | $999 | $6 |
| RX 7900 XTX 24GBAMD | 24 ГБ | 960 ГБ/с | 166.8 | $900 | $5 |
| RTX 3090 24GBNVIDIA | 24 ГБ | 936 ГБ/с | 162.5 | $900 | $6 |
| A30 24GBNVIDIA | 24 ГБ | 933 ГБ/с | 162.0 | $4,500 | $28 |
| A40 48GBNVIDIA | 48 ГБ | 696 ГБ/с | 155.3 | $5,000 | $32 |
| RTX 3080 10GBNVIDIA | 10 ГБ | 760 ГБ/с | 153.5 | $600 | $4 |
| RTX 5070 12GBNVIDIA | 12 ГБ | 672 ГБ/с | 150.0 | $549 | $4 |
| RTX 4070 Ti SUPER 16GBNVIDIA | 16 ГБ | 672 ГБ/с | 150.0 | $799 | $5 |
| Cloudblazer i30 32GBEnflame | 32 ГБ | 819 ГБ/с | 150.0 | $6,000 | $40 |
| RX 7800 XT 16GBAMD | 16 ГБ | 624 ГБ/с | 139.3 | $499 | $4 |
| A10 24GBNVIDIA | 24 ГБ | 600 ГБ/с | 123.8 | $3,500 | $28 |
| Mac M4 MaxApple | 64 ГБ | 546 ГБ/с | 112.5 | $4,000 | $36 |
| RTX 4070 Ti 12GBNVIDIA | 12 ГБ | 504 ГБ/с | 103.8 | $700 | $7 |
| RTX 4070 SUPER 12GBNVIDIA | 12 ГБ | 504 ГБ/с | 103.8 | $599 | $6 |
| RTX 4060 Ti 16GBNVIDIA | 16 ГБ | 288 ГБ/с | 92.3 | $499 | $5 |
| Mac M4 ProApple | 24 ГБ | 273 ГБ/с | 87.5 | $2,500 | $29 |
| Mac M4 16GBApple | 16 ГБ | 120 ГБ/с | 38.5 | $1,199 | $31 |