Stability AIが待望の画像生成AI、Stable Diffusion 3の提供を開始しました。この新しいモデルは、Stability AI Developer PlatformからAPI経由で利用できるようになっています。さらに、Stability AIはメンバー向けに自己ホスティング用のモデルウェイトの提供も予定しているとのことです。
API連携でサービス可用性を強化
Stability AIはFireworks AIとの提携により、Stable Diffusion 3と高速版の「Turbo」をAPIでアクセスできるようにしました。Fireworks AIとの協力により、エンタープライズに耐えうる99.9%のサービス可用性が保証されます。
進化した性能、プロンプト理解と文字再現に強み
Stability AIによると、Stable Diffusion 3は主要な競合モデル(DALL-E 3, Midjourneyなど)と同等の性能を持ちつつも、プロンプト(生成指示)への忠実度やタイポグラフィ(文字表現)の再現で優位性があるとされています。これは、画像とテキストを別々の重みで表現する新しいMultimodal Diffusion Transformer(MMDiT)アーキテクチャによって実現されているようです。
モデルのオープン化も進行中
APIでの提供に加え、Stability AI はメンバーに対してモデルウェイトの提供も積極的に行う方針です。また、一部ユーザーを対象とした「Stable Assistant Beta」の先行リリース版も提供されており、このバージョンにはStable Diffusion 3が含まれています。この限定公開版のStable Assistantでは、最新の画像・言語AIを活用したコンテンツ作成を試すことができます。
安全性への対策
オープンソースモデルとしてリリースされるStable Diffusion 3では、安全性を確保することはとりわけ重要です。Midjourney や他の主要なモデルが強力な悪用防止策を持っているのに対して、初期バージョンのStable Diffusionには改変されると悪意ある利用を可能にする脆弱性がありました。しかし、Stability AIはモデルの訓練段階からテスト・評価、実際の展開に至るまで、悪用への「妥当な対策」を講じており、研究者、専門家、そしてコミュニティとの連携のもと、モデルと安全性の改善を継続的に行うと表明しています。
今後の展開に期待!
Stable Diffusion 3は大きな可能性を秘めた画像生成AIです。API提供やモデルのオープン化を通じて、今後ますます多くの場面でその力を発揮することになるでしょう。