画像生成AI Stable Diffusion を試してみた

画像生成AI Stable Diffusion を試してみた

2023年11月18日 0 投稿者: macfancy

巷で話題?の

画像生成AI Stable Diffusion

を試してみました。

1.Stable Diffusion とは

Copilot」君の解答は、

Stable Diffusionとは、テキストから画像を生成するAIモデルです。

潜在拡散モデルというアルゴリズムを使って、入力されたテキストに一致するように画像を徐々に変化させて

いきます。人物や動物、風景など、さまざまな画像を生成できます。

【私が自分のPCローカル環境で生成した画像例】

「富士山」,「湖」で生成した画像です

「富士山(Mt.FUJI)」「湖(lake)」で生成した画像です

「山(mountain)」「湖(lake)」で生成した画像です。

Stable Diffusionは、英国のStability AI社が開発したもので、オープンソースとして公開されています。

Stable Diffusionを使うには、Webアプリケーションやローカル環境で動かすことができます。

Webアプリケーションでは、Hugging Face³やDream Studioなどのサービスを利用できます。

ローカル環境では、GitHubからリポジトリをクローンして、PythonとGitをインストールする必要があります。

Stable Diffusionは、テキストだけでなく、画像をベースにして新しい画像を生成することもできます。

また、生成された画像の品質やバリエーションを調整することもできます。

Stable Diffusionは、画像生成AIの中でも高品質で創造的な画像を生成する能力が高いと評価されています。

2.Stable Diffusion を使ってできること

Stable Diffusionを使って、テキストから画像を生成することができます。

例えば、「緑の目をした赤毛の女性」というテキストを入力すると、そのような女性の画像を生成できます。

また、画像をベースにして新しい画像を生成することもできます。

例えば、「この猫に帽子をかぶせる」という指示を与えると、猫の画像に帽子を加えた画像を生成できます。

さらに、生成された画像の品質やバリエーションを調整することもできます。

例えば、「この画像をもっと鮮やかにする」という指示を与えると、画像の色彩を強調した画像を生成できます。

Stable Diffusionは、画像生成AIの中でも高品質で創造的な画像を生成する能力が高いと評価されています。

Stable Diffusionを使ってみたい場合は、Webアプリケーションやローカル環境で動かすことができます。

3.Stable Diffusion の始め方

   【Stable Diffusion 導入に必要な PC の推奨スペック】

推奨スペック
使用するPC デスクトップ型
OS Windows(64bit)
CPU 最新モデルのCore i5~Core i7、Ryzen 5~7
GPU RTX 30シリーズやRTX 40シリーズのVRAMが12GB以上
メモリ 16GB~32GB
ストレージ 512GB以上

 特に重要なのは、GPU グラフィックボードの VRAM12GB 以上が必要です。

 Stable Diffusion のPCスペックを充足していれば、

 無料かつ無制限で利用できるローカル環境を構築しましょう。

MSI MSI GeForce RTX 3060 VENTUS 2X 12G OC(LHR) / PCI Express 4.0 グラフィックスボード GeForce RTX 3060 VENTUS 2X 12G OC

一番使いやすい Stable Diffusion AUTOMATIC 1111 を設定していきます。

① Pythonをインストールする

    最新版のPythonでは動作しないので注意してください。

 Python 3.10.6はこちらからダウンロードできます。

② git をインストールする

  git の公式サイトを開いて「Click here to download」をクリックする。

 インストーラーを開いて「next」ボタンを複数回クリックしたのち

 「Finish」ボタンを押すだけです。

③Stable Diffusion をインストールする

  • Stable Diffsion をインストールするフォルダを作成
  • 作成したフォルダ上で右クリック→メニューから「Open Git Bash here」をクリック
  • コマンドプロンプトが開くので「git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git」と入力
  • コマンドが止まったら、インストール完了です。

➃Stable Diffusion を起動する

  • 作成したフォルダ>「stable-diffusion-webui」>「webui-user.bat」をクリックしてコマンドを実行させます。
  • コマンドが止まったら、ブラウザのアドレスバーに「http://127.0.0.1:7860/」を入力します。

インストールが上手く出来ていれば、Stable Diffsion の画面が開きます。プロンプト欄に生成したい画像のテキスト(英語)を入力して「生成」ボタンを押すとAIが画像を生成してくれます。

4.Stable Diffusion にモデルを使うと

Stable Diffusion には膨大な数のモデルが公開されています。

例えば、

【yayoi_mix】モデルを使うと

こんなに画像も

【yayoi_mix】を使って生成した画像です。

【MeinaMix】モデルを使うと

【MeinaMix】を使って生成した画像です。

こんな画像も生成することができます。

玄人志向 GALAKURO GG-RTX3060-E12GB/OC/DF / PCI Express 4.0 グラフィックスボード GG-RTX3060-E12GB/OC/DF

5.Stable Diffusion のポイント

  • Stable Diffusionは、オープンソースとして公開されています。
  • Webアプリケーションやローカル環境で動かすことができます。
  • Webアプリケーションでは、Hugging Face7やDream Studio8などのサービスを利用できます。
  • ローカル環境では、GitHubからリポジトリをクローンして、PythonとGitをインストールする必要があります。(GPU グラフィックボードの VRAM12GB 以上が必要)
  • インターフェイスの日本語化は可能だが、プロンプトの入力は「英語」である。
  • 公開されているモデルを活用して、ローカル環境で無限に画像生成することができます。

6.おまけ

【 Stable Diffusion で生成してみた AI生成画像 ギャラリー】

スライドショーには JavaScript が必要です。