Как установить Stable Diffusion на свой ПК

Как установить Stable Diffusion

Может возникнуть вопрос, зачем устанавливать Stable Diffusion на свой компьютер. Объясняем – по многим причинам. Локальная установка позволяет избежать цензуры,  задержек обработки, дает контроль над процессом, конфиденциальность и доступ к экосистеме инструментов с открытым исходным кодом. Открытый исходный код Stable Diffusion позволяет ее локальное использование и модификацию. Это способствует формированию сообщества, которое создает дополнительные инструменты (LoRA, расширения). Наличие этих инструментов повышает функциональность локальной установки по сравнению с онлайн-альтернативами. Это привлекает новых пользователей, которые, в свою очередь, могут вносить вклад в развитие экосистемы. Преимущество локальной установки заключается не только в стоимости или конфиденциальности, но и в доступе к циклу инноваций, управляемых сообществом, что отличает ее от онлан сервисов.

Подготовка системы: аппаратные и программные требования

Для успешной установки требуется соответствующим образом сконфигурированная среда. В данном разделе представлен перечень аппаратных и программных предпосылок. Несоблюдение указанных требований может привести к ошибкам при установке.

Аппаратные требования: детальный разбор

  1. Графический процессор (GPU):
    1. Совместимость с NVIDIA CUDA: Значительная часть экосистемы разработки ИИ, включая библиотеки для Stable Diffusion, использует платформу CUDA от NVIDIA. В связи с этим графические процессоры NVIDIA являются одним из наиболее совместимых и производительных вариантов для данной задачи. Хотя поддержка GPU от AMD и Intel существует, она может потребовать более сложной настройки и характеризоваться меньшей стабильностью.
    2. Объем видеопамяти (VRAM): Для генерации изображений объем видеопамяти (VRAM) графического процессора является более критичным параметром, чем его общая вычислительная мощность. Графический процессор с большим объемом VRAM может обрабатывать более крупные модели (например, SDXL) и генерировать изображения с более высоким разрешением. Например, видеокарта среднего класса с большим объемом VRAM (например, NVIDIA 3060 с 12 ГБ) может быть более предпочтительной для данной задачи, чем более производительная карта с меньшим объемом VRAM (например, NVIDIA 3080 с 10 ГБ).
    3. Уровни VRAM: 4 ГБ — это минимальный объем, требующий использования флагов экономии памяти и приводящий к снижению производительности. 6-8 ГБ — рекомендуемый базовый уровень для работы со стандартными моделями, такими как SD 1.5. 12 ГБ или более рекомендуется для работы с продвинутыми моделями, такими как SDXL, апскейлинга и экспериментов с обучением.
  2. Системная оперативная память (RAM): 16 ГБ является стандартным минимумом. Однако 32 ГБ — более предпочтительная отправная точка, так как система будет использовать RAM для компенсации при исчерпании VRAM.
  3. Хранилище: Рекомендуется минимум 20 ГБ свободного места на твердотельном накопителе (SSD). Приложение и его зависимости занимают ~12-15 ГБ, а каждый файл модели-чекпоинта — это дополнительные 2-7 ГБ. SSD важен для быстрой загрузки моделей.
  4. Особенности архитектуры Apple Silicon: Чипы Apple серии M используют унифицированную архитектуру памяти, где системная RAM разделяется между CPU и GPU. Следовательно, Mac с чипом M1/M2 и 16 или 32 ГБ оперативной памяти может выполнять задачи, требующие эквивалентного объема выделенной VRAM на ПК, что делает эти устройства эффективными для работы со Stable Diffusion.

Программные зависимости

  1. Python 3.10.6: Требуется именно эта версия Python. Более новые версии (3.11+) могут быть несовместимы с ключевыми библиотеками, такими как PyTorch, что может привести к ошибкам при установке.
  2. Git: Эта система контроля версий необходима для загрузки (клонирования) программного обеспечения AUTOMATIC1111 из его репозитория на GitHub и для его обновления.
  3. Homebrew (только для macOS): Для пользователей macOS Homebrew является стандартным менеджером пакетов для установки необходимых инструментов командной строки, включая Python и Git.

Анализ сообщений о проблемах показывает, что значительная часть ошибок связана не с самим программным обеспечением Stable Diffusion, а с неправильной настройкой системной среды. Процесс установки зависит от корректной конфигурации предварительных условий. Таким образом, данный раздел является важным этапом подготовки.

Больше инструкций, реальных кейсов и примеров из практики по AI для бизнеса, работы и жизни в Telegram-канале, подпишитесь!

ХарактеристикаWindows (Минимум)Windows (Рекомендуется)macOS (Apple Silicon Рекомендуется)
Операционная системаWindows 10/11Windows 10/11macOS 11 или выше
Процессор (CPU)Intel i5 / Ryzen 5Intel i7 / Ryzen 7Apple M1/M2 или новее
Оперативная память (RAM)16 ГБ32 ГБ или больше16 ГБ или больше
Видеокарта (GPU)NVIDIA с поддержкой CUDANVIDIA RTX 30-й серии или новееВстроенный GPU в чипе Apple
Видеопамять (VRAM)4 ГБ12 ГБ или больше16 ГБ+ унифицированной памяти
Хранилище20 ГБ свободного места (SSD)50 ГБ+ свободного места (SSD)20 ГБ+ свободного места (SSD)
Ключевое ПОPython 3.10.6, GitPython 3.10.6, GitHomebrew, Python 3.10.6, Git

Руководство по установке для Windows (GPU NVIDIA)

В данном руководстве представлена пошаговая процедура установки AUTOMATIC1111 на систему Windows 10/11 с графическим процессором NVIDIA. Для предотвращения распространенных ошибок рекомендуется точно следовать приведенным инструкциям.

Шаг 1: Установка зависимостей (Python и Git)

  1. Python 3.10.6: Загрузите 64-битный установщик Windows с официального сайта Python. Во время установки на первом экране необходимо установить флажок «Add Python 3.10 to PATH». Этот шаг важен для корректной работы, и его пропуск является частой причиной ошибок при установке.
  2. Проверка: После установки откройте новое окно командной строки (нажмите клавишу Windows, введите cmd, нажмите Enter) и выполните команду python —version. Вывод должен быть Python 3.10.6. В противном случае следует удалить другие версии Python и выполнить переустановку.
  3. Git: Загрузите и запустите установщик Git для Windows. Можно принять настройки по умолчанию на всех этапах мастера установки.

Шаг 2: Клонирование репозитория AUTOMATIC 1111

  1. Откройте командную строку. Перейдите в место, где вы хотите установить Stable Diffusion. Для удобства доступа рекомендуется использовать домашнюю папку пользователя. Используйте команду: cd %userprofile%.
  2. Выполните следующую команду для загрузки программного обеспечения: git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git. Это создаст папку с именем stable-diffusion-webui в вашем текущем местоположении.

Шаг 3: Загрузка и размещение модели-чекпоинта

  1. Для генерации изображений требуется базовая модель. Для начинающих пользователей рекомендуется официальная модель Stable Diffusion v1.5 из-за ее широкой совместимости и поддержки сообщества.
  2. Загрузите файл модели (обычно с расширением .safetensors) из ее репозитория на Hugging Face.
  3. Используя проводник Windows, перейдите в папку, созданную на предыдущем шаге, и поместите загруженную модель в эту конкретную подпапку: stable-diffusion-webui\models\Stable-diffusion.

Шаг 4: Первый запуск и настройка

  1. В проводнике перейдите в корневую папку stable-diffusion-webui и найдите файл webui-user.bat. Дважды щелкните этот файл, чтобы начать установку и запуск.
  2. Процесс может занять продолжительное время (10-20 минут или более). Этот скрипт загрузит несколько гигабайт необходимых библиотек Python (таких как PyTorch) и настроит виртуальную среду. Этот процесс автоматический, но требует стабильного подключения к интернету и происходит только при первом запуске.
  3. После успешного завершения в окне командной строки отобразится сообщение Running on local URL: http://127.0.0.1:7860. Скопируйте и вставьте этот URL в свой веб-браузер, чтобы получить доступ к интерфейсу.
  4. Настройка после установки: Файл webui-user.bat является основным инструментом для оптимизации. Щелкните правой кнопкой мыши по файлу и выберите «Изменить», чтобы открыть его в Блокноте. Найдите строку set COMMANDLINE_ARGS= и добавьте аргументы. Рекомендуется добавить —xformers для повышения производительности на картах NVIDIA и git pull в строке перед call webui.bat, чтобы программное обеспечение автоматически обновлялось при каждом запуске.

Руководство по установке для macOS (Apple Silicon)

Это руководство подробно описывает процесс установки для компьютеров Mac, оснащенных Apple Silicon (M1, M2 и т.д.). Процесс основан на использовании Терминала и менеджера пакетов Homebrew.

Шаг 1: Установка зависимостей с помощью Homebrew

  1. Homebrew: Откройте приложение Терминал. Если Homebrew не установлен, его можно установить, вставив команду с официального сайта brew.sh.
  2. В отличие от процесса для Windows, Homebrew позволяет установить необходимое программное обеспечение одной командой, что может снизить вероятность ошибки.
  3. Выполните следующую команду в Терминале для установки всех предпосылок: brew install cmake protobuf rust python@3.10 git wget.

Шаг 2: Клонирование репозитория

  1. В Терминале перейдите в желаемый каталог установки с помощью команд, таких как cd ~/Desktop (для перехода на рабочий стол).
  2. Выполните команду клонирования: git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git.

Шаг 3: Загрузка и размещение модели-чекпоинта

  1. Этот шаг идентичен процессу для Windows. Загрузите базовую модель, такую как SD v1.5, и поместите ее в каталог stable-diffusion-webui/models/Stable-diffusion с помощью Finder.

Шаг 4: Первый запуск

  1. В Терминале перейдите во вновь созданный каталог: cd stable-diffusion-webui.
  2. Выполните скрипт запуска: ./webui.sh.
  3. Как и в версии для Windows, первый запуск инициирует загрузку и установку зависимостей и модели по умолчанию. Последующие запуски будут выполняться быстрее.
  4. После завершения Терминал отобразит локальный URL (http://127.0.0.1:7860), который вы можете открыть в браузере. Для обновления программного обеспечения в будущем выполните git pull из этого каталога перед запуском.

Первые шаги в AUTOMATIC1111: обзор вкладки txt2img

Данный раздел содержит обзор основного интерфейса txt2img и объяснение ключевых параметров, управляющих генерацией изображений. Эффективное использование интерфейса предполагает методичный, итеративный подход к настройке параметров.

Основные компоненты интерфейса

  1. Stable Diffusion Checkpoint: Это выпадающее меню для выбора модели. Каждый файл .ckpt или .safetensors, помещенный в папку models/Stable-diffusion, появится здесь.
  2. Prompt и Negative Prompt: В поле промпта описывается желаемое изображение. В поле негативного промпта перечисляются концепции, которые следует исключить (например, blurry, deformed, watermark).
  3. Синтаксис промпта и внимание: Можно увеличить фокус модели на слове, заключив его в скобки, например, a photo of a ((cat)). Несколько скобок добавляют больше веса. Также можно указать числовой вес, например, (cat:1.3).
  4. Sampling Method и Sampling Steps: Семплер — это алгоритм, используемый для генерации; Euler a и DPM++ 2M Karras являются подходящими вариантами для начала работы. Sampling Steps определяют количество шагов уточнения. Большее количество шагов может улучшить детализацию, но увеличивает время генерации; 20-30 шагов — это диапазон для получения качественных результатов.
  5. Размер изображения (Width и Height): Рекомендуется генерировать изображения с разрешением, близким к нативному разрешению модели (например, 512×512 для SD 1.5, 1024×1024 для SDXL), чтобы предотвратить искажения.
  6. CFG Scale: Этот параметр контролирует, насколько строго ИИ придерживается промпта. Низкое значение (например, 3-6) дает ИИ больше свободы. Умеренное значение (7-10) обеспечивает баланс. Высокое значение (12+) заставляет ИИ следовать промпту более буквально.
  7. Seed: Seed — это начальное значение для генератора случайных чисел. Seed, равный -1, будет каждый раз создавать новое изображение. Если результат удовлетворителен, можно скопировать его номер seed в это поле, чтобы воспроизвести тот же результат, что позволяет итеративно уточнять другие настройки. Возможность зафиксировать seed для получения воспроизводимого результата является ключевой функцией, позволяющей контролировать переменные в процессе генерации.

Устранение распространенных проблем при установке и выполнении

В процессе установки или эксплуатации могут возникать технические проблемы. В данном разделе представлен систематический подход к решению распространенных ошибок.

Общие рекомендации по устранению неполадок (для обеих ОС)

  1. Обновите WebUI: Программное обеспечение регулярно обновляется. Откройте терминал/CMD в каталоге stable-diffusion-webui и выполните git pull. Эта команда может решить проблемы, вызванные устаревшим кодом.
  2. Принудительно обновите зависимости: При подозрении на повреждение файлов или несоответствие зависимостей, удалите папки venv и repositories в каталоге stable-diffusion-webui. Затем снова запустите скрипт (webui-user.bat / ./webui.sh). Это инициирует новую установку всех зависимостей.

Проблемы, специфичные для Windows

  1. Ошибка OutOfMemoryError: CUDA out of memory: Данная ошибка, распространенная в ОС Windows, указывает на недостаток видеопамяти (VRAM) графического процессора.
    • Решение: Отредактируйте webui-user.bat и добавьте аргументы командной строки в строку set COMMANDLINE_ARGS=. Сначала попробуйте —medvram. Если ошибка сохраняется, используйте —lowvram. Это уменьшает использование VRAM за счет скорости генерации.
  2. Ошибка: ModuleNotFoundError или Python не распознан:
    • Причина: Как правило, связана с некорректной установкой Python (неверная версия, или не был установлен флажок «Add to PATH») или конфликтами из-за нескольких версий Python.
    • Решение: Удалите все версии Python с вашей системы, перезагрузите ПК и выполните чистую установку Python 3.10.6, убедившись, что флажок «Add to PATH» установлен.

Проблемы, специфичные для macOS

  1. Низкая производительность / Медленная генерация:
    • Причина: Ускорение на GPU может быть неэффективным или содержать ошибки.
    • Решение: Запустите web UI с флагами производительности. В Терминале выполните ./webui.sh —opt-split-attention-v1. Если производительность остается низкой, попробуйте ./webui.sh —medvram. В крайнем случае, можно заставить процесс работать на CPU (что будет медленно, но стабильно), отредактировав файл webui-user.sh и установив export COMMANDLINE_ARGS=»—skip-torch-cuda-test —no-half —use-cpu all».
  2. Ошибка после обновления macOS (например, до Sonoma):
    • Причина: Крупные обновления ОС могут нарушить работу зависимостей, таких как PyTorch.
    • Решение: Сообщество часто разрабатывает исправления. Это может потребовать редактирования скрипта webui.sh для принудительной переустановки определенных библиотек. Для проблемы с Sonoma пользователи нашли решение, добавив export TORCH_COMMAND=»pip install —pre —upgrade torch torchvision torchaudio —index-url https://download.pytorch.org/whl/nightly/cpu» и специфические аргументы командной строки.

Информация для устранения неполадок часто находится на платформах сообщества, таких как Reddit, GitHub и Stack Overflow. Это означает, что база знаний по поддержке Stable Diffusion является динамической и поддерживается сообществом. Важным навыком для устранения неполадок является способность эффективно осуществлять поиск на данных ресурсах. Рекомендуется использовать точное сообщение об ошибке в качестве поискового запроса на платформах GitHub и Reddit. Такой подход позволяет пользователям находить решения для широкого круга проблем.

Больше инструкций, реальных кейсов и примеров из практики по AI для бизнеса, работы и жизни в Telegram-канале, подпишитесь!

guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии