トップへ戻る

Stable Diffusion XL(SDXL)ついに公開!

Announcing SDXL 1.0

2023年7月26日に予告通り「Stable Diffusion XL(以降、SDXL)」が公開されました。SDXLは、

  • Stable Diffusion(1.4/1.5)
  • Stable Diffusion(2.0/2.1)

の後継としてリリースされました。

何が違うの?

ベース解像度のアップ

一つ目は、1024×1024がベースになったので格段に美しくなったことです。今まで苦手だった「手」、「文字」などが格段に改善されています。

 

SDXL generates images of high quality in virtually any art style and is the best open model for photorealism. Distinct images can be prompted without having any particular ‘feel’ imparted by the model, ensuring absolute freedom of style. SDXL 1.0 is particularly well-tuned for vibrant and accurate colors, with better contrast, lighting, and shadows than its predecessor, all in native 1024×1024 resolution.

In addition, SDXL can generate concepts that are notoriously difficult for image models to render, such as hands and text or spatially arranged compositions (e.g., a woman in the background chasing a dog in the foreground).

SDXLは、事実上あらゆるアートスタイルで高品質の画像を生成し、フォトリアリズムに最適なオープンモデルです。SDXLは、フォトリアリズムに最適なオープンモデルであり、モデルによって特定の「フィール」を付与されることなく、個性的な画像を生成することができます。SDXL 1.0は、1024×1024のネイティブ解像度で、コントラスト、ライティング、シャドウが前モデルよりも向上し、鮮やかで正確な色に特に調整されています。

さらに、SDXLは、手とテキストや空間的に配置された構図(たとえば、前景で犬を追いかける背景の女性)など、イメージモデルにとってレンダリングが難しいコンセプトを生成できます。

プロンプト解釈精度の向上

二つ目は、プロンプトの解釈精度が向上しています。品質向上系の「masterpiece」などは不要となりました。

 

2段階アーキテクチャの採用

ベースモデルとリファイナーの二段階アーキテクチャを採用することで、8GBのVRAMで速度を犠牲にすることなく動作するようになりました。

ファインチューニング

チェックポイント(学習モデル)やLoRAの作成が簡単になります。ControlNetを使用しての画像コントロールは現在ベータ版ですが近い将来公開されます。

 

どこで試せる?

以下のサイトで今すぐ試すことができます。

また、自分で試したい方は

で使うことができます。

学習モデル、LoRA

Stable Diffusionでは、1.5系/2.1系/SDXL系で学習モデルやLoRAなどの互換性はありません。

CititAIやHugging FaceでSDXL1.0対応版が公開され始めていますのでチェックしてください。

かなりのスピードで公開されると思います。