FLUX.1とは、Stable Diffusionの開発社が設立したBlack Forest Labsが開発したStable Diffusionよりもクオリティの高い画像が作成できる画像生成AIです。
一言でいうと文章からクオリティの高い画像を作成できるStable Diffusionを超えるAI画像生成ツールとなります。
これまでの画像生成AIでは、長文を記述すると生成結果が破綻する、または要求が無視されるといったことが起きていましたが、FLUX.1では長文でも正しく情報を取得し、詳細な表現へ繋げてくれます。
そのため、Stable Diffusionより詳細な描写が可能となっており、AI画像特有の破綻が少なくなっています。
Flux.1の特徴
本章では、以下4つの項目について解説します。
※引用元 SHIFTAIより https://shift-ai.co.jp/blog/6270/
Flux(フラックス)とは「プロンプト(指示文)から高精度でリアルな画像を生成できるAIツール」です。使用目的に応じた3つの異なるモデルを提供しており、プロフェッショナルなクリエイターやデザイナーにとって強力なツールです。
元Stable Diffusionの開発者たちが設立したBlack Forest Labsによって開発された画像生成AIです。Stable Diffusionは、AI画像生成の分野で有名なプロジェクトであり、Fluxはその技術をさらに進化させたものです。この開発チームによって構築されたFluxは、より洗練された画像生成能力を備えています。
Fluxは画像生成AIモデルとして公開されているため、使うためにはFluxが組み込まれたプラットフォームを利用する必要があります。代表的なプラットフォームは、Black Forest Labs公認の「fal.ai」、「Replicate」、「mystic.ai」です。
Fluxの4つの特徴
【特徴①】複数のモデルを提供
Fluxには、schnell、dev、proという3つのモデルがあり、それぞれのニーズに応じて選ぶことができます。
schnellは最も高速な処理が特徴で、個人利用向けに最適化されています。devは研究や開発向けで、高品質な画像が生成可能ですが商業利用には問い合わせが必要です。proは商用利用に対応し、最高品質の画像生成が可能です。
【特徴②】高いプロンプト再現性
Fluxはプロンプト(入力された指示文)を忠実に再現し、期待通りの画像を生成する能力に優れています。これにより、クリエイティブな表現を最大限に引き出すことが可能です。
【特徴③】高品質な画像生成
生成される画像は非常に高品質で、人体や風景などのディテールの生成にも優れています。Fluxはプロフェッショナルな用途においても満足できるクオリティを提供します。特にproモデルは最高品質の画像を生成可能です。
上記に掲載の画像の例では、女性の髪の1本1本や、桜の枝のディティールまで非常に高品質に生成されています。
【特徴④】高速な生成速度
schnellモデルでは、高速な画像生成が可能です。これにより、大量の画像を短時間で作成する必要があるプロジェクトにも対応できます。
上に掲載の動画の例では、1024×768の高品質な画像3枚がわずか3秒程(1枚当たり1秒)で生成されています。
Fluxの料金プラン
Fluxの料金
Fluxの料金プランは、プラットフォームごとに料金体系が異なります。ここでは、3つのモデルが使用可能で、Black Forest Labs公認のプラットフォームについての料金を掲載しています。
「fal.ai」はMP(メガピクセル=100万ピクセル)ごとの料金になっており、「Replicate」は画像1枚当たりの料金になっています。「mystic.ai」は、schnellモデルとdevモデルは月額プランに加入して利用可能であり、proモデルは画像サイズとステップ数(多いほど高品質になる)に依存した料金になっています。
Fluxの使い方
ここでは、プラットフォームとして「fal.ai」を利用する方法で解説します。
「fal.ai」の利用にはGitHubアカウントが必要です。すでにGitHubアカウントを持っている方は、【使い方①】はスキップし、【使い方②】へ進んでください。
【使い方①】GitHubアカウントの作成とログイン
STEP
以下のURLからGitHubの公式サイトにアクセス
STEP
「サインアップ」または「GitHubに登録する」をクリック
STEP
「Enter your email」にメールアドレスを入力し、「Continue」をクリック
STEP
「Create a password」にパスワードを設定し、「Continue」をクリック
STEP
「Enter a username」にユーザー名を設定し、「Continue」をクリック
STEP
「Continue」をクリック
※GitHubからの最新情報等を受け取る場合は「Receive occasional product updates and announcements.」にチェック
STEP
「検証する」をクリックし、ロボットでないことの検証を行う
STEP
登録したメールアドレスに送られた8桁のコードを入力
STEP
GitHubのサインイン画面になるので、「ユーザー名またはメールアドレス」と「パスワード」を入力し、「Sign in」をクリック
STEP
アンケートフォームが表示されるので回答、または「Skip personalization」をクリックしてスキップ
STEP
GitHubへのログインが完了
URL:https://fal.ai/
【使い方②】fal.aiアカウントの作成
STEP
以下のURLからfal.aiの公式サイトにアクセス
URL:https://fal.ai/
STEP
「Sign-up」をクリック
STEP
「Continue with Github」をクリック
※GitHubにログインしていない場合は、この後でGitHubにログイン
STEP
「Authorize fal-ai」をクリック
fal.aiアカウントの作成が完了し、fal.aiのログイン後のホーム画面に移動します。
【使い方③】クレジットの購入
画像生成を行うには、あらかじめ有料のクレジットを購入しておく必要があります。
STEP
「Billing」をクリック
STEP
「Add payment methods」をクリック
クレジットカード、Google pay、アメリカの銀行口座のいずれかを選択して支払い方法を登録
STEP
「Add Credits」の購入したい金額を選択し、「Buy」をクリック
【使い方④】画像の生成
STEP
「Explore」をクリック
STEP
使用したいモデルを選択
ここではFLUX.1[pro]を選択して進めます
STEP
「Prompt」に生成したい画像の指示を入力し、「Run」をクリック
「More」をクリックで、より詳細な設定をすることも可能です。
- Image Size(画像サイズ):生成される画像のアスペクト比と解像度。
- Num Inference Steps(推論ステップ数):画像生成を行う際のステップ数。多いほど高品質になるが生成時間も長くなる。
- Seed(シード):同じシードと同じプロンプトを与えると、毎回同じ画像が出力される。
- Guidance scale(ガイダンススケール):プロンプトへの忠実度。高いほど忠実になるが創造性が低くなりやすい。
- Sync Mode(同期モード):trueにすると、処理が遅くなるが完成画像がすぐ表示される。falseにすると、バックグラウンドで画像生成されるが完成画像は後で表示される。
- Num Images (画像数):一度の生成する画像の枚数。
- Safety Tolerance(安全許容範囲):画像が安全で適切かどうかをチェックする寛容さ。低いほど厳しく、高いほど寛容。
ここでは、「More」の設定は変更せず、以下のプロンプトで生成します。
- プロンプト
- 和訳
Extreme close-up of a single tiger eye, direct frontal view. Detailed iris and pupil. Sharp focus on eye texture and color. Natural lighting to capture authentic eye shine and depth. The word “FLUX” is painted over it in big, white brush strokes with visible texture.
STEP
画像が生成されます
とても高品質で、プロンプトに忠実な画像が生成されています。
Fluxの解説は以上です。