Локальное развертывание нейросетевых моделей на своем ноутбуке без видеокарты. Нейросреда
Цель: Освоить запуск больших языковых моделей на собственном компьютере, обеспечивая конфиденциальность данных и независимость от облачных сервисов.
Преимущества локального развертывания:
Конфиденциальность: Данные не передаются на сторонние серверы, обеспечивая полную конфиденциальность.
Автономность: Работа с моделью не зависит от наличия интернет-соединения.
Дообучение: Возможность кастомизации модели под специфические задачи путем дообучения на собственных данных.
Экономия: Избежание затрат на использование облачных API, оплачиваются только расходы на электроэнергию.
Необходимое ПО и сервисы:
VPN или прокси с американским IP-адресом:
Рекомендованный сервис: (детальная инструкция по настройке в разделе “Настройка VPN/прокси“).
Некоторые модели и ресурсы могут быть доступны только с американских IP-адресов.
Ollama:
Инструмент для простого развертывания и управления локальными LLM.
Поддерживает широкий спектр моделей, включая LLaMa, Jais, Mistral, Qwen и другие.
LM Studio:
Графический пользовательский интерфейс, упрощающий взаимодействие с локально развернутыми LLM.
Альтернатива работе через командную строку.
(Опционально) ScriptRun:
Платформа для развертывания моделей в облаке и организации сложных pipelines с использованием нескольких моделей.
Настройка VPN/прокси:
Зарегистрируйтесь на .
В личном кабинете выберите “Сервисы“ - “Купить прокси“.
Выберите тип прокси “Резидентские“.
Выберите локацию “Соединенные Штаты Америки“.
Оплатите выбранный тариф и получите данные для доступа к прокси-серверу (IP-адрес, порт, логин, пароль).
Настройте ваш браузер или операционную систему для использования прокси, следуя инструкциям на сайте или в документации вашего ПО.
Развертывание LLM:
Способ 1: Ollama (через командную строку):
Загрузите установочный файл Ollama для вашей ОС с .
Установите Ollama, следуя инструкциям установщика.
Откройте командную строку (терминал).
На сайте в разделе “Models“ выберите нужную модель.
Скопируйте команду запуска модели (например, run llama-32).
Вставьте команду в командную строку и нажмите Enter.
Для взаимодействия с моделью вводите промпты в командной строке.
Способ 2: LM Studio (графический интерфейс):
Скачайте и установите LM Studio с .
Запустите приложение.
Нажмите кнопку “Download Model“ или “Add Model“.
Выберите нужную модель из списка доступных или укажите путь к скачанному файлу модели.
После загрузки модели вы сможете взаимодействовать с ней через интерфейс LM Studio.
Квантование моделей:
Квантование — это техника сжатия моделей, уменьшающая их размер и требования к ресурсам. Квантованные модели могут работать быстрее и требовать меньше оперативной памяти, но при этом незначительно теряют в качестве генерации.
Дообучение моделей:
Дообучение позволяет адаптировать модель к специфическим задачам и данным. Для дообучения необходимо подготовить датасет и использовать специализированные инструменты. Рекомендуется проводить дообучение на мощных серверах или в облачных сервисах, таких как Google Colab.
Дополнительная информация:
GitHub Ollama: (исходный код, документация, примеры)
Документация LM Studio:
Ресурсы по промпт-инжинирингу: (ссылки на релевантные ресурсы, например, гайды, статьи, сообщества)
Этот материал предоставляет базовые знания для локального развертывания LLM. Рекомендуется дополнительно изучить документацию Ollama и LM Studio, а также ознакомиться с ресурсами по промпт-инжинирингу для более эффективного взаимодействия с моделями
🔗 Телеграм-канал
🔗 Чат по нейронкам
4,582 views
464
142
2 weeks ago 01:26:44 23
Лекция 14. Мобильные приложения
3 weeks ago 00:52:44 209
🤖📝Как аннотировать тексты с помощью ML, если ресурсы ограничены?
4 weeks ago 00:11:55 2
Srcbook NEW AI Coding Agent BEATS v0, Cursor, , & Cline! Generate Full-Stack Applications
1 month ago 00:49:38 106
Олег Киселев. ВВС Финляндии в Зимней войне. Истребители. Часть 2
1 month ago 00:50:28 9.2K
Локальное развертывание нейросетевых моделей на своем ноутбуке без видеокарты. Нейросреда
2 weeks ago 01:35:28 98
Трекинг экспериментов в MLflow: PyTorch и Scikit-learn
2 months ago 01:28:24 1
Мастер-класс “От кода до Kubernetes со всеми остановками“ / Лев Николаев (Экспресс 42)
2 months ago 01:42:04 514
PostgreSQL и DevOps - управляем базой данных через CI/CD и Kubernetes // Демо-занятие курса «PostgreSQL. Advanced»
3 months ago 00:23:15 71
Ansible автоматизация - разворачиваем Apache на localhost
3 months ago 00:23:30 130
Настройка Lando для Symfony проекта
3 months ago 00:46:28 8
Контейнерная оркестрация с плавным переходом к k8s
3 months ago 00:00:16 47
️ Llama 3.2 : релиз VLM, SLM моделей и дистрибутива Llama Stack . Только что были опубликованы набор моделей семейства Lllama 3.
3 months ago 01:50:34 285
Знакомство с Kubernetes: основные понятия и архитектура // Демо-занятие курса «Инфраструктурная платформа на основе Kubernetes»
4 months ago 00:03:54 4
Обзор AirMagnet Survey PRO для планирования, проектирования, развертывания и диагностики WiFi сетей
4 months ago 00:24:50 9
Мастерство LLM: Развертывание и использование языковых моделей локально | Игорь Акимов
4 months ago 01:45:19 1.5K
Вебинар «Почта для бизнеса VK WorkSpace в вашем дата-центре: новые возможности для крупного бизнеса»
4 months ago 00:02:41 6
SaaS или On-premise: за и против. Часть #9 | РА в бизнесе
4 months ago 00:08:08 215
[РЕД ОС] Настройка PXE с аутентификацией и KICKSTART в РЕД ОС 7.2
4 months ago 01:24:06 6.8K
SC24EP20 Развёртывание сервисов в Kubernetes - Разработка проектов со Spring
4 months ago 01:25:16 13
Helm vs werf: практическое сравнение с демонстрацией и реальными примерами. Встреча с сообществом
5 months ago 00:02:28 1
Vite in 100 Seconds
5 months ago 00:11:27 14
Все что нужно знать о работе с Hugging Face за 10 минут!
5 months ago 01:12:03 8
Kubernetes Crash Course for Absolute Beginners [NEW] [s_o8dwzRlu4] | TechWorld with Nana
5 months ago 03:36:54 171
Kubernetes Tutorial for Beginners [FULL COURSE in 4 Hours] [X48VuDVv0do] | TechWorld with Nana