Z-Image-Turboで画像に英中バイリンガルテキストを生成する方法

こんにちは、Doraです。今週、小さなバイリンガルラベル付きのクリーンな商品モックアップが必要でした。英語2語と中国語2語で、その朝5度目のFigmaを開きたくなかった。そこで Z-Image-Turboを再び試してみました。以前にも素早いコンセプトショットで使ったことがありましたが、気になっていたのは：文字をぐちゃぐちゃにすることなく、実際に読める英語/中国語テキストを画像に配置できるのか？

短い答え：多くの場合、できます。常にではない。でも成功したとき、驚くほど頭の負担が軽くなります。以下は数回のセッションからのメモです。一貫して機能したこと、躓いた部分、そしてZ-Image-Turboでバイリンガルテキストを画像に生成したいときに違いを生んだプロンプト。

Z-Image-Turboのテキストレンダリング機能

バイリンガルプロンプトの理解

最初に気づいたこと：言語の組み合わせを過剰に説明する必要がなかった。Z-Image-TurboはEnglishと中国語のプロンプトを理解し、多言語テキストを画像に直接レンダリングできます。「CALM TEA」と「静茶」のように英語と中国語のフレーズを引用符で囲んで単一のプロンプトに書くと、Z-Image-Turboは両方を尊重する傾向がありました。各フレーズをランダムな文字としてではなく、一つの単位として扱っているようでした。(English + Simplified Chinese)のような短い補足を加えると、少し精度が上がりました。劇的な改善ではなく、運頼みに感じることが少し減る程度です。

実際には、中国語の文字列を短く一般的なものに保つと、文字化けが減りました。日常的な言葉は詩的な表現や珍しい漢字よりも安定していました。句読点も重要でした：全角句読点はモデルを迷わせることがありました。通常の引用符の方が装飾的なものより効果的でした。

画像内のネイティブな英語/中国語テキスト

うまくいくとき、テキストは画像にネイティブに見えます。商品ラベル、ポスター、ソーシャルグラフィックでテストしました。英語は中国語よりも鮮明に保たれることが多かったですが、Z-Image-Turboは小〜中サイズで多くの一般的な漢字をきれいに処理しました。1つのフレームに英語と中国語を混在させると、短いフレーズで約10回中7回は読めるアウトプットが得られました。これは普遍的な真実ではなく、約30回のレンダリングで私が見た結果です。シードと構図を固定してテキストだけを変えたので、成功は偶然ではなく意図的なものに感じられました。

最も良かったのは配置です。モデルはテキストを単に貼り付けるのではなく、構図として試みます。お茶の缶では、缶の表面に合わせてラベルをわずかに曲げました。バナーでは左から右、上から下の流れを尊重しました。これは完璧ではありません。エッジがぼやけたり、カーニングがずれたりすることもあります。でも素早いコンセプト作業やソーシャル投稿では、ネイティブな見た目が気軽な一瞥をすり抜けることがよくあります。

テキストレンダリングが最も機能するとき

短いテキスト（1〜5語）

短いフレーズがスイートスポットです。各言語で1〜5語が私には最も効果的でした。「CALM TEA」と「静茶」のようなシンプルなペアは、文章よりもはるかに安定していました。文字数が増えると、ずれのリスクが高まります。欠けた部首、入れ替わった順序、あるいはまだ間違って読めるあの不思議な「ほぼ正しい」感覚。短く保つことが常に時間を節約するわけではありませんが、やり直しを減らしてくれました。

一般的なタイポグラフィスタイル

クリーンなサンセリフやシンプルなディスプレイフォントの方が良い結果でした。ハイコントラストのDidoneやテクスチャのあるブラシスクリプトをお願いすると、モデルは独自の解釈をしました。美しいこともありましたが、読みにくかった。明瞭さが目標なら：ボールドサンズ、ジオメトリックサンズ、またはミニマルグロテスクを目指しましょう。セリフは「legible serif」と指定してサイズを大きめにすれば使えます。中国語には、均一なストローク幅のサンズが通常最も安全でした。

ポスターとバナーのレイアウト

フラットでグラフィカルなレイアウトは良いテキストを促します。Z-Image-Turboはタイプを主要な形として扱えるときに最もうまく機能するようです。ポスター、バナー、ヒーロー画像、これらがアライメントとコントラストを決めるのに役立ちました。ごちゃごちゃした写真に小さなバイリンガルキャプションを重ねようとすると、より躓きました。色のブロックでポスターをモックアップして見出しに英語、サブヘッドに中国語をお願いすると、ノイズの多いシーンよりも両方が読める状態を保つことが多かったです。

テキストのプロンプティング

明示的なテキスト指示

文字通りに書くことが効果的でした。プロンプトを明示的な引用符と役割でフォーマットします：

headline: “CALM TEA”
subhead (Simplified Chinese): “静茶”
include both lines as actual text, not decorative shapes

さらに追加します：bilingual text (English + Simplified Chinese), accurate spelling。モデルがずれた場合はnudge：preserve exact characters。魔法ではありませんが、試行錯誤を減らします。

プロンプトの残りは簡潔に保ちます：短いスタイルフレーズ、ベースカラー、サーフェスまたはフォーマット（ポスター、ラベル、バナー）。雰囲気、比喩、追加オブジェクトを詰め込むほど、文字が劣化しました。

フォントスタイルの指定

実際のフォント名は使いません。特性を説明します：「bold sans-serif, even stroke, high legibility」または「minimal serif, generous letterspacing」。中国語には「clean sans Chinese type, balanced strokes」を追加します。出力が芸術的すぎる場合はavoid distorted or abstract glyphsを追加します。小さなメモ：スペーシングの用語が役立ちます。見出しにはtight tracking、ラベルにはnormal tracking。カーニングが常に守られるわけではありませんが、これらのヒントで方向を誘導できます。

シーン内のテキスト配置

タイプのスペースを確保したときにより安定した結果が得られました。次のようなフレーズ：centered headline area: top-left badge: label panel on the front of a tin。曲面には：wrap text to surface, maintain legibilityを追加します。コントラストが落ちた場合、次のレンダリングでincrease contrast between text and backgroundを続けてプロンプトするとたいてい修正できました。

配置が本当に重要な場合は、レイアウトの手がかりを含めます：A/Bブロック、静かなマージン、または「grid-based layout」。細かく聞こえますが、あるバナーでは5回から2回の再試行に減りました。

実践例

商品ラベル（英語 + 中国語）

お茶の缶ラベルを2行でモックアップしました：英語を上に、中国語を下に。重要だったプロンプトの要素：front-facing cylindrical tin, matte label panel, bold sans English headline “CALM TEA”, Simplified Chinese subhead “静茶”, high contrast, preserve exact characters。3回の実行で、2回はコンセプトアートとして十分クリーンでした。3回目は2文字目が入れ替わっていました。近いけど間違い。preserve exact charactersで素早く再実行したら修正されました。

光沢のあるボトルでは、反射がストロークをにじませることがありました。matte labelまたはsoft diffused lightをお願いすると改善されました。

ソーシャルメディアグラフィック

正方形の投稿では、テキストを英語の見出しと小さな中国語タグに絞りました。うまくいったプロンプトの一例：minimalist poster style, centered grid, headline “FOCUS”, Simplified Chinese tag “専注”, bold sans, high legibility, no decorative distortion。通常1〜2回の試行で読めるアウトプットが得られました。グラデーションやテクスチャ背景を求めると、テキストが溶け込み始めました。solid color block behind textまたはclear marginを追加すると元に戻りました。

6バリエーションのバッチの時間を計りました。固定シードで、約15分で許容できるセットを作成しました。Figmaではフォント探しを含めて25〜30分かかっていたでしょう。大きな時間の節約ではありませんが、頭への負担が軽い。

マーケティングバナー

広いキャンバスは横並びのバイリンガルラインに向いていました：英語左、中国語右。「START HERE」/「从这里开始」のような短い行動喚起は中サイズで問題ありませんでした。小さなフッターの細かい文字を求めると、忠実度は急速に落ちました。私の代替案：ヒーローテキストをモデルで生成し、法的コピーはデザインツールで追加する。この分担により、バナーを視覚的に一貫したものに保ちながら、難しい部分、つまり小さなサイズでの実際の読みやすさを尊重できます。

制限と回避策

長いテキストの課題

1行5語を超えると失敗率が上がります。特に中国語では。ストロークが融合したり、1文字が芸術的な休暇を取ったりします。フレーズを含める必要がある場合は分割します：2つの短い行、それぞれ別々の実行で検証。また、複数の再試行の覚悟がなければ、珍しい句読点や珍しい字形は避けます。

生成後にテキストを追加するタイミング

リスクに基づいて線引きします。コンセプトや雰囲気が文字の完璧な忠実度より重要なソーシャル投稿であれば、Z-Image-Turboにテキストをレンダリングさせます。パッケージング、UI、または法的に敏感なものであれば、生成後にテキストを追加します。モデルは構図とムードを提供し、デザインツールはコントロールと確実性を提供します。ピクセルレベルのフラストレーションから救ってくれる穏やかな分業です。

インペインティングとの組み合わせ

レイアウトは正しいのにテキストが1文字ずれているとき、インペインティングが役立ちます。まだ試していない方は、この短いZ-Image-Turbo インペイントガイドでマスキングと再プロンプト戦略を解説しています。テキスト修正がはるかにクリーンになります。

問題のある単語の上に小さなマスクを定義して、引用符で囲んだ正確な文字列にpreserve exact characters, high legibilityを加えて再プロンプトします。マスクをタイトに保ち、背景をシンプルにすることで、字形を修正しながらテクスチャを保持します。ポスターでは、画像全体をやり直すことなく、惜しかったミスの約半分を救えました。

最後に一言：各成功をローカルなものとして扱います。グローバルではない。異なるシーンと照明は確率を変えます。Z-Image-Turboで初めてバイリンガルテキスト（英語/中国語）を画像に生成しようとしているなら、短い言葉、シンプルなタイプ、クリーンなレイアウトから始めましょう。うまくいけば少し広げる。抵抗するなら戦わない、テキストは後で追加する。どちらにしても、作業は軽く感じられます。

曲線や部首を目を細めて見つめて、本当にそこにあるか確認している自分に気づくことがあります。ほとんどの日、その小さな一瞬は価値があります。