• AI

【AI】世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開

1: 田杉山脈 ★ 2023/07/18(火) 00:40:42.01 ID:qV56tycV

Stability AIは6月26日、画像生成AIの最新モデル「Stable Diffusion XL」を発表しました(「画像生成AI『Stable Diffusion』最高性能の新モデル『SDXL 0.9』一般的なPCで実行可能」)。パラメーター数がオリジナルのStable Diffusionの9億から23億へと大幅に拡大され、描写力が飛躍的に上昇したモデルです。正式版のSDXL 1.0が7月18日に公開予定とあり、あらためて注目されています。ベータ版にあたるSDXL 0.9は先行して、有料課金サービス「DreamStudio」と、Discordでの公開を開始していました。Discordでは1人無料で1回出力可能で、いまもリアルタイムで生成画像が見える状態です。その後SDXL 0.9は研究用に公開されて、ダウンロード可能になりました。

SDXLがこれまでのStable Diffusionの仕組みと決定的に違うのは、1回の画像生成で2回生成するプロセスを取っていることです。

プロンプトが画像として生成されるデータセットが「ベース(Base)」と「リファイナー(Refiner)」の2種類に分かれるんですね。なぜこんなやり方をするかというと、2種類のクリップ(画像とテキストとの紐付けのこと)で学習をさせているようなんです。一度、プロンプトを通じてデータセットで生成した画像データを、さらに別のデータセットを使って精度を上げていくという仕組みになっています。

実際に、10日にいち早くSDXLに対応した「ComfyUI」というアプリでSDXL 0.9を動かしてみました。ComfyUIはノードベースのGUIに特徴があり、生成を処理する手順を、割と自由に設計できるところに特徴があります。オープンソースで開発が続けられており、Stable Diffusionを動かす有力なアプリの一つです。

ComfyUIではどのように作業が進むのかを見ることができるのですが、生成が開始されると入力したプロンプトが、2つのサンプラー(生成機)に送られます。最初のサンプラーがベース(Base)と呼ばれるデータセットを使って、一度画像を生成して出力した後、もう一つのサンプラーから、リファイナー(Refiner)に入れて、画質を引き上げる仕組みになっていることがわかります。画像の基本サイズも512×512ピクセルから1024×1024ピクセルに大きくなりました。

ただし、そのぶん生成のために要求するスペックが上がっていて、NVIDIA GeForce RTX 20シリーズ以上、ビデオメモリー8GB以上が環境として求められます。

出力できる画像の幅は大幅に広がっていることはすぐに実感できます。たとえば猫とか、ジャングルを進む探検隊、香港の未来の町並み、ブロンズに金の液体をかける……といった思いつく限りの単語を適当に英訳してプロンプトにしてみたのですが、過去のものとは違い、複雑なプロンプトを組まなくても様々な画風が出てきました。特に学習データに偏りがあったと言われるv1.5で出てこなかった東洋人風の顔や、いわゆるアニメ風の二次元の画像もかなり出してくれます。これは相当様々なテクニックが探索されることになるのではないかと思えます。
以下ソース
https://ascii.jp/elem/000/004/145/4145553/

2: 名刺は切らしておりまして 2023/07/18(火) 01:00:20.16 ID:C+VhSP+H
Stable Diffusionほど個人では流行らないだろうな
今の賑わいはNAIの派生・マージで成り立ってるようなものだし

 

6: 名刺は切らしておりまして 2023/07/18(火) 01:19:00.02 ID:NozAClTl
>>2
今の需要はエロ絵が欲しいだけで新技術に興味ある奴はそこまで多くないからな
そういう奴はSD1.5とAOM3あたりで事足りてしまってる

 

7: 名刺は切らしておりまして 2023/07/18(火) 01:23:04.81 ID:WmwDoW8u
タグのない画像を仕分けする技術がまだサイバー空間に存在しない 未整理だと人力でしかできない

 

10: 名刺は切らしておりまして 2023/07/18(火) 02:43:52.29 ID:7V4mMrZp
この会社資金回らなくなって死にそうになってるって聞いたけど大丈夫?

 

11: 名刺は切らしておりまして 2023/07/18(火) 02:48:15.50 ID:UHBo8NCX
ろくな事に使われない確信だけはあるな。まじでろくな事に使われないだろ

 

16: 名刺は切らしておりまして 2023/07/18(火) 03:29:18.15 ID:myh3JNPP
どうやって始めたら良いかわからん

 

17: 名刺は切らしておりまして 2023/07/18(火) 05:02:21.08 ID:HzMy+O49

乱数の組み合わせは有限なのに

こんなものも出せるようになりましたってのは別に進化でもなんでも無いのよ
人間側が馬鹿だから単純な装置を知能か何かのように錯覚する

 

18: 名刺は切らしておりまして 2023/07/18(火) 05:06:12.20 ID:gF5qKbU4
>>17
その単純な装置に負けてるのも人間である
メンテナンスの観点から言えば機械は単純であればあるほどよい

 

20: 名刺は切らしておりまして 2023/07/18(火) 05:30:19.63 ID:T5bOtEqe
AIさん、エッチな絵ばかり描かされてるんだろうな

 

24: 名刺は切らしておりまして 2023/07/18(火) 06:52:36.46 ID:zH6JM3nj
パクリ能力が向上したのか

管理人からひと言

すごいと思う

引用元

【AI】世界を変えた画像生成AI、さらに進化「Stable Diffusion XL(SDXL)」いよいよ正式公開 [田杉山脈★] (2ch.sc)

  • コメント: 0

関連記事

  1. 【ソフトウェア】履歴書チェックソフトウェアが何百万人もの有能な求職者をはじいてしまっているという指摘…

  2. 【AI】AI開発、5割は失敗 知の利器のあやうさ悟る

  3. AIで目の動きから性格を予測・分類するシステム。お前らも知らないうちに分類される日が来るぞ

  4. 【革命】ソニーの新特許、AIを使ってゲームのアートスタイルを変更できる特許

  5. 【NZ】ギターを弾いてAIが上手いと認めるとビールが無料で出てくる自販機が登場

  6. 【実業家】ソフトバンク孫氏、「AI分野に私の頭の97%を専念させる」

  7. OpenAI日本法人に「AWSジャパン前社長」が移籍 4月中旬開設の東京オフィスで重要任務担う?

  8. 【ガンダム】AIロボット「ハロ」会話機能アップデート 「逆襲のシャア」を語る…本体価格は14万904…

  9. カテゴリ_AI

    AIおじさんと戯れるスレあるいは人工知能総合

コメント

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

最近の人気記事

おすすめ記事

新着記事

  1. パソコンに詳しい奴きてくれSSDかUSBケーブルが壊れた
  2. 【原文ママ】NTTグループ、AIで橋のビビやサビを検出する技術
  3. 米グーグルに独禁法違反疑い、日本の公取委が調査 ヤフー広告を制限
  4. Windows10、定期的に「Windows11にしろ」と全画面表示へ
  5. 【AI】OpenAI、日本語処理を3倍速く 国産AIの脅威に

ボンブの戯言

  1. 【ボンブの戯言】ITエンジニアが徹夜してでも間に合わせる理由
  2. 【ボンブの戯言】はじめました。
  3. 【ボンブの戯言】フリーランスが払う税金など6選!私たちはこんなに支払っている!
  4. 【ボンブの戯言】ITエンジニアがフリーランスになるときに考える・準備すること
  5. 【ボンブの戯言】サーバーって何なの(オンプレに限る)
PAGE TOP