画像生成AI Stable Diffusion を試してみた
Contents
巷で話題?の
画像生成AI Stable Diffusion
を試してみました。
1.Stable Diffusion とは
「Copilot」君の解答は、
Stable Diffusionとは、テキストから画像を生成するAIモデルです。
潜在拡散モデルというアルゴリズムを使って、入力されたテキストに一致するように画像を徐々に変化させて
いきます。人物や動物、風景など、さまざまな画像を生成できます。
【私が自分のPCローカル環境で生成した画像例】
Stable Diffusionは、英国のStability AI社が開発したもので、オープンソースとして公開されています。
Stable Diffusionを使うには、Webアプリケーションやローカル環境で動かすことができます。
Webアプリケーションでは、Hugging Face³やDream Studioなどのサービスを利用できます。
ローカル環境では、GitHubからリポジトリをクローンして、PythonとGitをインストールする必要があります。
Stable Diffusionは、テキストだけでなく、画像をベースにして新しい画像を生成することもできます。
また、生成された画像の品質やバリエーションを調整することもできます。
Stable Diffusionは、画像生成AIの中でも高品質で創造的な画像を生成する能力が高いと評価されています。
2.Stable Diffusion を使ってできること
Stable Diffusionを使って、テキストから画像を生成することができます。
例えば、「緑の目をした赤毛の女性」というテキストを入力すると、そのような女性の画像を生成できます。
また、画像をベースにして新しい画像を生成することもできます。
例えば、「この猫に帽子をかぶせる」という指示を与えると、猫の画像に帽子を加えた画像を生成できます。
さらに、生成された画像の品質やバリエーションを調整することもできます。
例えば、「この画像をもっと鮮やかにする」という指示を与えると、画像の色彩を強調した画像を生成できます。
Stable Diffusionは、画像生成AIの中でも高品質で創造的な画像を生成する能力が高いと評価されています。
Stable Diffusionを使ってみたい場合は、Webアプリケーションやローカル環境で動かすことができます。
3.Stable Diffusion の始め方
【Stable Diffusion 導入に必要な PC の推奨スペック】
推奨スペック 使用するPC デスクトップ型 OS Windows(64bit) CPU 最新モデルのCore i5~Core i7、Ryzen 5~7 GPU RTX 30シリーズやRTX 40シリーズのVRAMが12GB以上 メモリ 16GB~32GB ストレージ 512GB以上
特に重要なのは、GPU グラフィックボードの VRAM12GB 以上が必要です。
Stable Diffusion のPCスペックを充足していれば、
無料かつ無制限で利用できるローカル環境を構築しましょう。
一番使いやすい Stable Diffusion AUTOMATIC 1111 を設定していきます。
① Pythonをインストールする
最新版のPythonでは動作しないので注意してください。
Python 3.10.6はこちらからダウンロードできます。
② git をインストールする
git の公式サイトを開いて「Click here to download」をクリックする。
インストーラーを開いて「next」ボタンを複数回クリックしたのち
「Finish」ボタンを押すだけです。
③Stable Diffusion をインストールする
- Stable Diffsion をインストールするフォルダを作成
- 作成したフォルダ上で右クリック→メニューから「Open Git Bash here」をクリック
- コマンドプロンプトが開くので「git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git」と入力
- コマンドが止まったら、インストール完了です。
➃Stable Diffusion を起動する
- 作成したフォルダ>「stable-diffusion-webui」>「webui-user.bat」をクリックしてコマンドを実行させます。
- コマンドが止まったら、ブラウザのアドレスバーに「http://127.0.0.1:7860/」を入力します。
4.Stable Diffusion にモデルを使うと
Stable Diffusion には膨大な数のモデルが公開されています。
例えば、
【yayoi_mix】モデルを使うと
こんなに画像も
【MeinaMix】モデルを使うと
こんな画像も生成することができます。
5.Stable Diffusion のポイント
- Stable Diffusionは、オープンソースとして公開されています。
- Webアプリケーションやローカル環境で動かすことができます。
- Webアプリケーションでは、Hugging Face7やDream Studio8などのサービスを利用できます。
- ローカル環境では、GitHubからリポジトリをクローンして、PythonとGitをインストールする必要があります。(GPU グラフィックボードの VRAM12GB 以上が必要)
- インターフェイスの日本語化は可能だが、プロンプトの入力は「英語」である。
- 公開されているモデルを活用して、ローカル環境で無限に画像生成することができます。
6.おまけ
【 Stable Diffusion で生成してみた AI生成画像 ギャラリー】