• AI

【AI】世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開

1: 田杉山脈 ★ 2023/07/18(火) 00:40:42.01 ID:qV56tycV

Stability AIは6月26日、画像生成AIの最新モデル「Stable Diffusion XL」を発表しました(「画像生成AI『Stable Diffusion』最高性能の新モデル『SDXL 0.9』一般的なPCで実行可能」)。パラメーター数がオリジナルのStable Diffusionの9億から23億へと大幅に拡大され、描写力が飛躍的に上昇したモデルです。正式版のSDXL 1.0が7月18日に公開予定とあり、あらためて注目されています。ベータ版にあたるSDXL 0.9は先行して、有料課金サービス「DreamStudio」と、Discordでの公開を開始していました。Discordでは1人無料で1回出力可能で、いまもリアルタイムで生成画像が見える状態です。その後SDXL 0.9は研究用に公開されて、ダウンロード可能になりました。

SDXLがこれまでのStable Diffusionの仕組みと決定的に違うのは、1回の画像生成で2回生成するプロセスを取っていることです。

プロンプトが画像として生成されるデータセットが「ベース(Base)」と「リファイナー(Refiner)」の2種類に分かれるんですね。なぜこんなやり方をするかというと、2種類のクリップ(画像とテキストとの紐付けのこと)で学習をさせているようなんです。一度、プロンプトを通じてデータセットで生成した画像データを、さらに別のデータセットを使って精度を上げていくという仕組みになっています。

実際に、10日にいち早くSDXLに対応した「ComfyUI」というアプリでSDXL 0.9を動かしてみました。ComfyUIはノードベースのGUIに特徴があり、生成を処理する手順を、割と自由に設計できるところに特徴があります。オープンソースで開発が続けられており、Stable Diffusionを動かす有力なアプリの一つです。

ComfyUIではどのように作業が進むのかを見ることができるのですが、生成が開始されると入力したプロンプトが、2つのサンプラー(生成機)に送られます。最初のサンプラーがベース(Base)と呼ばれるデータセットを使って、一度画像を生成して出力した後、もう一つのサンプラーから、リファイナー(Refiner)に入れて、画質を引き上げる仕組みになっていることがわかります。画像の基本サイズも512×512ピクセルから1024×1024ピクセルに大きくなりました。

ただし、そのぶん生成のために要求するスペックが上がっていて、NVIDIA GeForce RTX 20シリーズ以上、ビデオメモリー8GB以上が環境として求められます。

出力できる画像の幅は大幅に広がっていることはすぐに実感できます。たとえば猫とか、ジャングルを進む探検隊、香港の未来の町並み、ブロンズに金の液体をかける……といった思いつく限りの単語を適当に英訳してプロンプトにしてみたのですが、過去のものとは違い、複雑なプロンプトを組まなくても様々な画風が出てきました。特に学習データに偏りがあったと言われるv1.5で出てこなかった東洋人風の顔や、いわゆるアニメ風の二次元の画像もかなり出してくれます。これは相当様々なテクニックが探索されることになるのではないかと思えます。
以下ソース
https://ascii.jp/elem/000/004/145/4145553/

2: 名刺は切らしておりまして 2023/07/18(火) 01:00:20.16 ID:C+VhSP+H
Stable Diffusionほど個人では流行らないだろうな
今の賑わいはNAIの派生・マージで成り立ってるようなものだし

 

6: 名刺は切らしておりまして 2023/07/18(火) 01:19:00.02 ID:NozAClTl
>>2
今の需要はエロ絵が欲しいだけで新技術に興味ある奴はそこまで多くないからな
そういう奴はSD1.5とAOM3あたりで事足りてしまってる

 

7: 名刺は切らしておりまして 2023/07/18(火) 01:23:04.81 ID:WmwDoW8u
タグのない画像を仕分けする技術がまだサイバー空間に存在しない 未整理だと人力でしかできない

 

10: 名刺は切らしておりまして 2023/07/18(火) 02:43:52.29 ID:7V4mMrZp
この会社資金回らなくなって死にそうになってるって聞いたけど大丈夫?

 

11: 名刺は切らしておりまして 2023/07/18(火) 02:48:15.50 ID:UHBo8NCX
ろくな事に使われない確信だけはあるな。まじでろくな事に使われないだろ

 

16: 名刺は切らしておりまして 2023/07/18(火) 03:29:18.15 ID:myh3JNPP
どうやって始めたら良いかわからん

 

17: 名刺は切らしておりまして 2023/07/18(火) 05:02:21.08 ID:HzMy+O49

乱数の組み合わせは有限なのに

こんなものも出せるようになりましたってのは別に進化でもなんでも無いのよ
人間側が馬鹿だから単純な装置を知能か何かのように錯覚する

 

18: 名刺は切らしておりまして 2023/07/18(火) 05:06:12.20 ID:gF5qKbU4
>>17
その単純な装置に負けてるのも人間である
メンテナンスの観点から言えば機械は単純であればあるほどよい

 

20: 名刺は切らしておりまして 2023/07/18(火) 05:30:19.63 ID:T5bOtEqe
AIさん、エッチな絵ばかり描かされてるんだろうな

 

24: 名刺は切らしておりまして 2023/07/18(火) 06:52:36.46 ID:zH6JM3nj
パクリ能力が向上したのか

管理人からひと言

すごいと思う

引用元

【AI】世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 [田杉山脈★] (2ch.sc)

  • コメント: 0

関連記事

  1. モデルの仕事は消滅? 画像生成AIに葛藤する広告業界

  2. 【半導体】AI半導体で溶ける境界 NVIDIAがCPU参入、Intelに対抗

  3. 【AI】AIトップ人材育成へ 若手研究者に2000万円支給の新制度 文科省

  4. 【IT】AMD、AI向け半導体を23年内に投入 NVIDIA1強に対抗

  5. Apple 独自生成AI APPLEGPTを開発中。Siri「ですよね!!」

  6. AIに食われるの確定してるのに今プログラマーになろうと勉強してる奴なんなの?

  7. カテゴリ_AI

    【IT】写真をアニメキャラクターに変換できる技術が登場

  8. 【AI】OpenAI、ChatGPTに新機能 1度の指示で会話の流れ判断

  9. 文系卒25歳事務マンだが、今からpythonを本気で勉強しようと思う

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

最近の人気記事

おすすめ記事

新着記事

  1. わあ、ITパスポート勉強中、基数法がだるすぎる
  2. 心優しいVIPPERがITの実務を全く分からない俺にいろいろ教えてくれるスレ
  3. 何でお前らIT業界に就職しなかったの?
  4. 日本のITが遅れている本当の理由
  5. ワイSESエンジニア手取りが25万しかもらえなくて泣く

ボンブの戯言

  1. 【ボンブの戯言】ITエンジニアが徹夜してでも間に合わせる理由
  2. 【ボンブの戯言】ITエンジニアは、なぜうつ病になるのか
  3. 【ボンブの戯言】フリーランスが払う税金など6選!私たちはこんなに支払っている!
  4. 【ボンブの戯言】ITエンジニアがフリーランスになる理由
  5. 【ボンブの戯言】サーバーって何なの(オンプレに限る)
PAGE TOP