
Adobe Firefly(画像生成AI)の練習と、他社との比較をしてみました。
Adobe Fireflyとは
簡単な文章(プロンプト)をもとに、画像や装飾文字を生成します。
著作権侵害の恐れがないコンテンツだけを AI の学習に用いているため、企業が利用しやすいのが特徴です。
Adobe Fireflyは無料で使用することができます。
所定の利用上限を超えて使用したい場合、Adobe Fireflyプレミアムプランの単体利用料金は680円/月です。(2023/11現在)
良いと感じた点
- 日本語の文章理解度が非常に高い。
- 生成した画像のダウンロードファイル名がプロンプトした文章になるので整理がしやすい。
- 他社(StableDiffusion)より生成スピードが速い。(14秒でデフォルトの4コマ)
- クラウドQueue待ちがない。
- 指定(写真、アート等)直感的で簡単。
- 長文で明確にAI指示できれば狙ったイメージに近くなる。
- 参考画像を指定して生成が簡単にできる。
注意点
- Adobeアカウントが必要。
- 慣用句は理解度が低い。(英語の慣用句は未検証)
- 短文だとかなりぶれる。
- 狙った画像を的確に生成するためにはプロンプトの工夫が必要(英語で明確に指示するなど)(他社AIも同じ)
- リアルの人間や動物(顔や手足)は厳しく、ホラーになる。(2023/11現在)
- 気になった生成画像はとりあえず全部保存したほうが良い。
短文生成
プロンプト:「日本の和服姿」

「姿」なので人間も欲しいが明示的に支持していないと「人」要素は描写されない。装飾的に多少「和服」への誤解(演舞衣装?)もあるようだ。

和服=侍なのだろうか?雰囲気が良い。
プロンプト:「門前の小僧、習わぬ経を読む」

読経する構図を欲しいが、書物を読む、になってしまう。慣用句の意味の生成にならないのは仕方がないか? 慣用句は理解されない。

顔がやや厳しい。石の表現が良い。
プロンプト:「At the gate, a young boy was reading out the sutra in an untrained voice.」(門のところで少年が未習の声をあげて経を読み上げている。 ※翻訳)●FireflyとStableDiffusionの比較


プロンプト:「日本の習字」


プロンプト:「日本の漢字」

感想:有りそうで無い漢字が生成される。日本として富士山も描写されている。書体が良い。
プロンプト:「東京の居酒屋」●FireflyとStable Diffusionの比較

居酒屋要素が薄いが雰囲気が良い。東京=下町路地なのだろうか。

東京の情緒ある繁華街の居酒屋が表現されている。
プロンプト:「林業ボランティア イベント」

感想:アートモードはよく描写されている。

感想:写真モードでリアル人間は少し厳しいものがある。(ホラーっぽくなる)
プロンプト:「吾輩は猫である」&「夏目漱石の『吾輩は猫である』」

感雰囲気が良い。そのまま何かに使える。

プロンプト 「夏目漱石の『吾輩は猫である』」にしてみた。
和テイストが付いた。

プロンプト 「夏目漱石の『吾輩は猫である』」にしてみた。
猫のリアル感はすごい。
長文生成
プロンプト:「上から下へかけて銀河がぼうとけむったような帯になってその下の方ではかすかに爆発して湯気でもあげているように見えるのでした」(宮沢賢治 『銀河鉄道の夜』より)

「帯のような銀河」が無視され「帯のような湯気」っぽくなっている。複数の比喩(~のような~が、~のように~だ)があると解釈が変わってしまう。色、雰囲気が良い。

「銀河鉄道」にふさわしい画像となった。指示はしていないが魚眼レンズ風の歪みが描写されている。
Illustrator(ver28)
プロンプト:「空飛ぶタイヤ」
評価:「空飛ぶ」は無視されたが、トラックのタイヤが描写された。パス数がすごいので手動では大変な苦労と技術が必要そうだ。

