Stability AI による SDXL 0.9 のリリース
先日、Stability AIは前モデルに比べて大幅に改善された画像と構成の詳細を生成する最新版の画像生成モデル、SDXL 0.9を発表しました。このモデルのリリースは、AIが生成する画像の実用的なアプリケーションに対する新たな道を開くことを期待しています。
SDXL 0.9: 革新的な画像生成モデル
進化した機能とそのアプリケーション
SDXL 0.9は、Stability AIがさまざまなクリエイティブおよび産業用途に対して超現実的な画像の生成において”飛躍”を遂げるために開発したものです。新モデルは前モデルと比較して画像と構成の詳細が大幅に改善されました。
ClipDrop経由でのアクセス
この新しいモデルは、ClipDropを経由してアクセス可能で、APIは間もなく利用可能になる予定です。また、モデルが1.0リリースに向けて進むにつれて、7月中旬にリサーチウェイトのオープンリリースが期待されています。
クリエイティブと産業用途への応用
映画、音楽、教育ビデオなどへの使用
SDXL 0.9は、映画、テレビ、音楽、教育ビデオ、デザインなどの超現実的な作品や産業用アプリケーションなど、生成AI画像の幅広いクリエイティブなユースケースを提供します。これらの機能により、最新モデルはAI画像の実世界アプリケーションの最前線に位置します。
SDXL 0.9 が提供する機能の進化
画像生成を超えた機能
SDXL 0.9では、基本的なテキストプロンプトに加えて、画像間のプロンプト(バリエーションを取得するために画像を入力する)、インペイント(画像内の欠落している部分を再構築する)、アウトペイント(既存の画像をシームレスに拡張する)などの多くの機能を提供します。
構成の強化とパラメーターの増加
3.5Bパラメーターと6.6Bパラメーターモデルアンサンブルパイプライン
SDXL 0.9での構成の強化は、以前のベータ版と比較してパラメーターの数が大幅に増加したことに起因します。このモデルには3.5Bパラメーターのベースモデルと6.6Bパラメーターモデルアンサンブルパイプラインがあります。対照的に、ベータ版では単一の3.1Bパラメーターモデルのみが使用されました。
OpenCLIP モデルの利用
奥行きが深く、解像度 1024×1024 のよりリアルな画像を生成するために、SDXL 0.9 では、これまでで最大の OpenCLIP モデル(OpenCLIP ViT-G/14)を含む2 つの CLIP モデルを使用します。
民生用ハードウェアのアクセシビリティとパフォーマンス
SDXL 0.9は、その高度な機能とモデルアーキテクチャにもかかわらず、最新のコンシューマGPUで実行できます。必要なのは、Windows 10または11またはLinuxオペレーティングシステム、16GBのRAM、およびNvidia GeForce RTX 20(同等以上)グラフィックカードだけです。少なくとも8GBのVRAM。Linuxユーザーは、16GBのVRAMを備えた互換性のあるAMDカードを使用できます。
ユーザーコミュニティによる評価
4月13日のベータ版の公開以来、SDXLは700,000枚を超える画像を生成し、「約7,000人」のDiscordコミュニティユーザーから「素晴らしい反応」を得ています。このプラットフォームでは定期的に「ショーダウン」が開催され、54,000枚の画像が投稿され、3,521枚のSDXL画像が勝者と宣言されます。
SDXL 0.9 の提供と今後の予定
在庫状況と今後の予定
SDXL 0.9は、Stability AIのClipDropプラットフォームで利用可能になり、APIおよびDreamStudioユーザーは6月26日にアクセスできるようになります。オープンソースバージョンを実行するコードは、GitHub経由で後で利用できるようになります。完全なSDXL 1.0モデルのオープンソースリリースは7月中旬を予定しています。
非営利の研究専用ライセンス
現在、SDXL 0.9は非営利の研究専用ライセンスの下でリリースされており、研究者はモデルへのアクセスをリクエストできます。
まとめ
Stability AIのSDXL 0.9は、AI画像生成の新たなフロンティアを示すものであり、その進化した機能と改善された構成の詳細は、AIが生成する画像の実用的なアプリケーションに対する新たな道を開くことを期待させています。モデルの進化とアクセシビリティは、その鮮明な画像の生成能力を、映画、音楽、教育ビデオなどの様々なクリエイティブな用途に活用するための新たな可能性を示しています。
よくある質問とその回答
Q1: SDXL 0.9はどのようなハードウェアで動作しますか? A1: Windows 10または11またはLinuxオペレーティングシステム、16GBのRAM、およびNvidia GeForce RTX 20(同等以上)グラフィックカードだけです。少なくとも8GBのVRAM。Linuxユーザーは、16GBのVRAMを備えた互換性のあるAMDカードを使用できます。
Q2: SDXL 0.9をどのようにアクセスできますか? A2: SDXL 0.9は、Stability AIのClipDropプラットフォームで利用可能です。APIおよびDreamStudioユーザーは6月26日にアクセスできるようになります。
Q3: SDXL 0.9はどのような用途に利用できますか? A3: SDXL 0.9は、映画、テレビ、音楽、教育ビデオ、デザインなどの超現実的な作品や産業用アプリケーションなど、生成AI画像の幅広いクリエイティブなユースケースを提供します。
Q4: 完全なSDXL 1.0モデルのリリースはいつ予定されていますか? A4: 完全なSDXL 1.0モデルのオープンソースリリースは7月中旬を予定しています。
Q5: SDXL 0.9はどのようなライセンスでリリースされていますか? A5: 現在、SDXL 0.9は非営利の研究専用ライセンスの下でリリースされており、研究者はモデルへのアクセスをリクエストできます。