Различия
Показаны различия между двумя версиями страницы.
| Предыдущая версия справа и слева Предыдущая версия Следующая версия | Предыдущая версия | ||
| develop:models [2026/01/02 22:08] – 192.168.1.159 | develop:models [2026/01/02 22:33] (текущий) – [Для RTX 4060 (8 ГБ VRAM)] 192.168.1.159 | ||
|---|---|---|---|
| Строка 3: | Строка 3: | ||
| {{tag>ai llm модели hardware gpu nvidia квантование}} | {{tag>ai llm модели hardware gpu nvidia квантование}} | ||
| - | ---- | + | |
| ==== Введение ==== | ==== Введение ==== | ||
| Данная документация содержит актуальную на 2026 год информацию по подбору, | Данная документация содержит актуальную на 2026 год информацию по подбору, | ||
| - | ---- | + | |
| ==== Аппаратная платформа (SFF Workstation) ==== | ==== Аппаратная платформа (SFF Workstation) ==== | ||
| Строка 32: | Строка 32: | ||
| | **NVIDIA GeForce RTX 3050 LP (6GB)** | 6 GB | ~170 мм | [[https:// | | **NVIDIA GeForce RTX 3050 LP (6GB)** | 6 GB | ~170 мм | [[https:// | ||
| - | ---- | + | |
| ==== Выбор моделей ИИ под объем VRAM (2026) ==== | ==== Выбор моделей ИИ под объем VRAM (2026) ==== | ||
| Строка 77: | Строка 77: | ||
| | **[[https:// | | **[[https:// | ||
| - | ---- | + | === Intel HD Graphics 530 / i7-6700, 32GB RAM === |
| + | |||
| + | ^ Модель ^ Параметры ^ Команда скачивания ^ Назначение ^ | ||
| + | | Qwen 3 | 7B | docker exec -it ollama ollama pull qwen3:7b | Лучший универсал для RU языка и n8n | | ||
| + | | DeepSeek R1 | 14B | docker exec -it ollama ollama pull deepseek-r1:14b | Сложная логика и кодинг (через рассуждения) | | ||
| + | | Mistral NeMo| 12B | docker exec -it ollama ollama pull mistral-nemo | Анализ длинных документов и суммаризация | | ||
| + | | Llama 3.2 | 3B | docker exec -it ollama ollama pull llama3.2:3b | Мгновенная классификация (самая быстрая) | | ||
| ==== Специализация моделей ==== | ==== Специализация моделей ==== | ||
| Строка 106: | Строка 112: | ||
| | **[[https:// | | **[[https:// | ||
| - | ---- | + | |
| ==== Глоссарий и справочник по квантованию ==== | ==== Глоссарий и справочник по квантованию ==== | ||
| Строка 134: | Строка 140: | ||
| | **\_L** (Large) | Минимальное сжатие (лучшее качество, | | **\_L** (Large) | Минимальное сжатие (лучшее качество, | ||
| - | ---- | + | |
| ==== Инструменты и ПО ==== | ==== Инструменты и ПО ==== | ||
| Строка 168: | Строка 174: | ||
| | **mradermacher** (автор IQ) | [[https:// | | **mradermacher** (автор IQ) | [[https:// | ||
| - | ---- | + | |
| ==== Прямые ссылки на ключевые модели (GGUF) ==== | ==== Прямые ссылки на ключевые модели (GGUF) ==== | ||
| Строка 189: | Строка 195: | ||
| Для **RTX 4060 (8 ГБ)** ищите модели от **`mradermacher`** (специализируется на IQ-квантах для 8 ГБ) или **`bartowski`**. Для моделей 12B-14B берите версию **`IQ3_M`**. | Для **RTX 4060 (8 ГБ)** ищите модели от **`mradermacher`** (специализируется на IQ-квантах для 8 ГБ) или **`bartowski`**. Для моделей 12B-14B берите версию **`IQ3_M`**. | ||
| - | ---- | + | |
| ==== Онлайн-сервисы и агрегаторы ==== | ==== Онлайн-сервисы и агрегаторы ==== | ||
| Строка 206: | Строка 212: | ||
| * **Перевод и транскрипция: | * **Перевод и транскрипция: | ||
| - | ---- | + | |
| ==== Новости и обновления ==== | ==== Новости и обновления ==== | ||
| Строка 235: | Строка 241: | ||
| </ | </ | ||
| - | {{page> | + | |