• AI

【AI】世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開

1: 田杉山脈 ★ 2023/07/18(火) 00:40:42.01 ID:qV56tycV

Stability AIは6月26日、画像生成AIの最新モデル「Stable Diffusion XL」を発表しました(「画像生成AI『Stable Diffusion』最高性能の新モデル『SDXL 0.9』一般的なPCで実行可能」)。パラメーター数がオリジナルのStable Diffusionの9億から23億へと大幅に拡大され、描写力が飛躍的に上昇したモデルです。正式版のSDXL 1.0が7月18日に公開予定とあり、あらためて注目されています。ベータ版にあたるSDXL 0.9は先行して、有料課金サービス「DreamStudio」と、Discordでの公開を開始していました。Discordでは1人無料で1回出力可能で、いまもリアルタイムで生成画像が見える状態です。その後SDXL 0.9は研究用に公開されて、ダウンロード可能になりました。

SDXLがこれまでのStable Diffusionの仕組みと決定的に違うのは、1回の画像生成で2回生成するプロセスを取っていることです。

プロンプトが画像として生成されるデータセットが「ベース(Base)」と「リファイナー(Refiner)」の2種類に分かれるんですね。なぜこんなやり方をするかというと、2種類のクリップ(画像とテキストとの紐付けのこと)で学習をさせているようなんです。一度、プロンプトを通じてデータセットで生成した画像データを、さらに別のデータセットを使って精度を上げていくという仕組みになっています。

実際に、10日にいち早くSDXLに対応した「ComfyUI」というアプリでSDXL 0.9を動かしてみました。ComfyUIはノードベースのGUIに特徴があり、生成を処理する手順を、割と自由に設計できるところに特徴があります。オープンソースで開発が続けられており、Stable Diffusionを動かす有力なアプリの一つです。

ComfyUIではどのように作業が進むのかを見ることができるのですが、生成が開始されると入力したプロンプトが、2つのサンプラー(生成機)に送られます。最初のサンプラーがベース(Base)と呼ばれるデータセットを使って、一度画像を生成して出力した後、もう一つのサンプラーから、リファイナー(Refiner)に入れて、画質を引き上げる仕組みになっていることがわかります。画像の基本サイズも512×512ピクセルから1024×1024ピクセルに大きくなりました。

ただし、そのぶん生成のために要求するスペックが上がっていて、NVIDIA GeForce RTX 20シリーズ以上、ビデオメモリー8GB以上が環境として求められます。

出力できる画像の幅は大幅に広がっていることはすぐに実感できます。たとえば猫とか、ジャングルを進む探検隊、香港の未来の町並み、ブロンズに金の液体をかける……といった思いつく限りの単語を適当に英訳してプロンプトにしてみたのですが、過去のものとは違い、複雑なプロンプトを組まなくても様々な画風が出てきました。特に学習データに偏りがあったと言われるv1.5で出てこなかった東洋人風の顔や、いわゆるアニメ風の二次元の画像もかなり出してくれます。これは相当様々なテクニックが探索されることになるのではないかと思えます。
以下ソース
https://ascii.jp/elem/000/004/145/4145553/

2: 名刺は切らしておりまして 2023/07/18(火) 01:00:20.16 ID:C+VhSP+H
Stable Diffusionほど個人では流行らないだろうな
今の賑わいはNAIの派生・マージで成り立ってるようなものだし

 

6: 名刺は切らしておりまして 2023/07/18(火) 01:19:00.02 ID:NozAClTl
>>2
今の需要はエロ絵が欲しいだけで新技術に興味ある奴はそこまで多くないからな
そういう奴はSD1.5とAOM3あたりで事足りてしまってる

 

7: 名刺は切らしておりまして 2023/07/18(火) 01:23:04.81 ID:WmwDoW8u
タグのない画像を仕分けする技術がまだサイバー空間に存在しない 未整理だと人力でしかできない

 

10: 名刺は切らしておりまして 2023/07/18(火) 02:43:52.29 ID:7V4mMrZp
この会社資金回らなくなって死にそうになってるって聞いたけど大丈夫?

 

11: 名刺は切らしておりまして 2023/07/18(火) 02:48:15.50 ID:UHBo8NCX
ろくな事に使われない確信だけはあるな。まじでろくな事に使われないだろ

 

16: 名刺は切らしておりまして 2023/07/18(火) 03:29:18.15 ID:myh3JNPP
どうやって始めたら良いかわからん

 

17: 名刺は切らしておりまして 2023/07/18(火) 05:02:21.08 ID:HzMy+O49

乱数の組み合わせは有限なのに

こんなものも出せるようになりましたってのは別に進化でもなんでも無いのよ
人間側が馬鹿だから単純な装置を知能か何かのように錯覚する

 

18: 名刺は切らしておりまして 2023/07/18(火) 05:06:12.20 ID:gF5qKbU4
>>17
その単純な装置に負けてるのも人間である
メンテナンスの観点から言えば機械は単純であればあるほどよい

 

20: 名刺は切らしておりまして 2023/07/18(火) 05:30:19.63 ID:T5bOtEqe
AIさん、エッチな絵ばかり描かされてるんだろうな

 

24: 名刺は切らしておりまして 2023/07/18(火) 06:52:36.46 ID:zH6JM3nj
パクリ能力が向上したのか

管理人からひと言

すごいと思う

引用元

【AI】世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 [田杉山脈★] (2ch.sc)

  • コメント: 0

関連記事

  1. 【AI】カゴメとNEC、トマト農家向けAI支援サービス拡充

  2. マイクロソフト「3秒の音声があれば声を合成できるAI開発しました」

  3. 【AI】AIトップ人材育成へ 若手研究者に2000万円支給の新制度 文科省

  4. カテゴリ_AI

    【AI】「獺祭」造りにAI…旭酒造、富士通と実証実験

  5. 【IT】米NYタイムズ、OpenAIを提訴 記事流用で数千億円損害

  6. AIが最適なルートを作成して運行するAIオンデマンドバス、23日から実証運行 松田

  7. 【AI脅威論】AIのリスクは現実だが対応可能 ビル・ゲイツ氏が見解

  8. AI「そうです。あなた様は世界一なのです」 お前ら「まあ、まあ、まあ!」

  9. カテゴリ_AI

    【実業家】堀江貴文「AIに仕事を奪われると歎くダサさ。搾取される側にいる人たちの残念な発想」

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

最近の人気記事

おすすめ記事

  1. カテゴリ_働き方
  2. カテゴリ_phone

新着記事

  1. 閉鎖のお知らせ
  2. SES社長だけど質問ある?
  3. windowsにAI搭載するとか言ってるけどさぁ
  4. 新卒エンジニア僕、資格勉強する気が起きない
  5. 文系学部卒一般企業志望の君の進路はここから選んでもらうぞ!→ 営業・販売・未経験…

ボンブの戯言

  1. 【ボンブの戯言】ITエンジニアがフリーランスになるときに考える・準備すること
  2. 【ボンブの戯言】ITエンジニアは、なぜうつ病になるのか
  3. 【ボンブの戯言】ITエンジニアがフリーランスになる理由
  4. 【ボンブの戯言】サーバーって何なの(オンプレに限る)
  5. 【ボンブの戯言】ITエンジニアが徹夜してでも間に合わせる理由
PAGE TOP