Skip to content

生成画像プロンプトを洗練

「赤い布の画像を作って」 AIにそう頼めば、確かに赤い布の画像は出てきます。しかし、それは果たしてストックフォトサイトで「売れる素材」と言えるでしょうか?

現在開発中の画像ストックサイト『free-images』では、単なる自動生成を超え、デザイナーが「これこそ探していた質感だ」と唸るクオリティを目指しています。今回は、Google Gemini APIを駆使したプロンプト改善の旅についてお話しします。

「名もなき色」に命を吹き込む

Section titled “「名もなき色」に命を吹き込む”

ストックフォトの世界では、「赤」や「青」といった単純な色名だけでは不十分です。例えば、Webデザインの背景として求められるのは、その色が持つ「空気感」や「深み」です。

そこで、Geminiに与える色指定を40種類以上の詳細なフレーズへとアップデートしました。

  • Before: Vivid Crimson Red
  • After: Vivid Crimson Red – with intense saturation and a smooth, velvety light falloff (鮮烈なクリムゾンレッド - 強い彩度と、滑らかでベルベットのような光の減衰)

この「ベルベットのような光の減衰」という一言があるだけで、AIは布の表面で光がどのように散らばり、影がどう落ちるかを計算し始めます。ただの赤い平面が、触れられそうなほどの 質感(テクスチャ) へと昇華されます。

ニッチを攻める:メタリックの魔力

Section titled “ニッチを攻める:メタリックの魔力”

サイトの差別化として注力したのが、ゴールド、シルバー、ブロンズといったメタリック素材です。金属の質感は、ライティングの指示一つで「安っぽいCG」にも「重厚な写真」にもなります。

今回、プロンプトに組み込んだのは以下のような「物理現象」への言及です。

  • Hammered Raw Silver: 多方向からの光を捉える「打ち出し加工」の凹凸。
  • Molten Liquid Bronze: 深い琥珀色の反射を伴う、流動的で粘り気のある表面。

これらに Specular highlights(鏡面反射)Micro-crystalline detail(微結晶のディテール) といった専門的なキーワードを掛け合わせることで、PCの計算リソースをフルに活かした、圧倒的なリアリティを実現しました。

デザイナーの視点をAIに教え込む

Section titled “デザイナーの視点をAIに教え込む”

プロンプトの改善は、AIを「画材」から「熟練のフォトグラファー」へ育てる作業に似ています。

単に綺麗なものを作らせるのではなく、「Minimalist composition(ミニマルな構図)」や「Top-down flat lay(真上からの俯瞰)」といった、商用利用で需要の高いアングルをランダムに選択させるロジックを組み込みました。

これにより、寝ている間に実行される「仮想カメラマン」たちは、常にストックフォトとして使い勝手の良い画像を量産してくれるようになったのです。

今回の改善を通じて感じたのは、「AI画像生成の限界は、人間の想像力と語彙力の限界である」ということです。

プロンプトエンジニアリングは、単なる技術的な作業ではなく、言葉の力で視覚的なリアリティを創り出すクリエイティブな挑戦です。