インターネット上でゴシップを追ったり、権利を主張したり、事実を裏付けたりする際、かつて我々が頼りにしてきたのは「画像こそが真実である」という 5 文字の言葉だった。
AI による画像生成が氾濫している現在でさえも、画像内に複雑な中国語の組版や、特定のソフトウェアの実際のインターフェースが登場すれば、AI はすぐに正体を現し、完全な「文字が読めない状態」に陥っていた。
画像提供:X@hx831126
しかし今、その時代は終わりを告げた。
誤字脱字を探したり、UI の不備を見つけたりして AI 画像を見抜くという時代は、ChatGPT を傘下に持つ画像生成モデル「GPT Image 2」の全ユーザーへの本格導入とともに、崩壊したのだ。
APPSO はいちばんに、最も苛酷な中国語のシナリオやビジネス上のニーズを課してストレステストを実施した。運試し(ガチャ)をする必要もなく、生成される画像はすべて予想を上回る出来栄えだった。
ChatGPT を開き、「+」マークをクリックして「画像を作成」を選択するか、右サイドバーのメニューから「画像」を見つけることで、GPT Image 2 が利用可能だ。現在、無料プランを含め、あらゆるサブスクリプションプランのユーザーがすぐに使用できる。
数学の試験用紙さえ偽造可能、中国語レンダリングの新王者
かつて「Nano Banana(※注:一般的に「Niji Journey」や「Midjourney v6」などの文字描写能力の高さを指す文脈か、あるいは特定のモデルの通称と推測されるが、原文ママの表現を維持しつつ、文脈として「文字描写に優れたモデル」として扱う)」は、文字のレンダリング能力を武器に、AI 画像生成界の「神」として君臨していた。しかし、Nano Banana とはいえども、大量のテキストを処理する際には、依然として文字の位置がずれたり、レイアウトが硬直したりする弱点があった。
現在、GPT Image 2 の登場により、その状況は完全に覆された。同モデルは中国語の字形を理解するだけでなく、極めて複雑な中国語の組版さえも掌握している。
GPT Image 2 を使用するには、複雑なプロンプトは不要だ。我々のテストでは、シンプルな画面の説明に、21:9、16:9、9:16 などのアスペクト比指定を付け加える程度で十分だった。
例えば、「広州市の小学生向けの数学の試験用紙を生成せよ」と指示してみよう。
プロンプト:広州市の小学生向けの数学の試験用紙を生成する
その結果は衝撃的だった。用紙上部の見出し、穴埋め問題の空欄を示す下線、幾何学図形の注釈、そして試験用紙特有の宋体や楷体といった書体のスタイルまでが正確に再現されている。一目見ただけでは、本物の試験用紙をスマートフォンで撮影した写真と見分けがつかない。
もしこのように統一されたフォントの文字生成が難しい任务ではないとするなら、次は中国の伝統的な書道で同モデルを試してみることにしよう。
プロンプト:『蜀道難(しょくどうなん)』の真跡画像を生成する
GPT Image 2 によれば、これも造作もないことだという。生成された書道の真跡画像に含まれる文字は正確なだけでなく、書道作品にふさわしい流れるような筆運びと力強い筆致を実現している。紙の経年変化による質感や、押印された印鑑の再現に至るまで完璧だ。
図版とテキストが混在する組版のテストにおいても、GPT Image 2 の出来栄えは隙が無く、文字化けやフォントの重なりも一切見られなかった。
プロンプト:2049 年 4 月 21 日発行の、黄ばんだ『今日の人공지능晩報』
AI モデルが、問題文付きの試験用紙や中国語のカレンダーを本物そっくりに生成できるようになった今、かつての成語「百聞は一見にしかず(眼见为实)」は、完全に打ち砕かれたと言えるだろう。
実際に小学 4 年生のあの試験用紙を小学生に見せれば、欠陥を見つけることは不可能に違いない。
テキストと連携し、デジタル世界を 1 対 1 で再現可能
中国語のレンダリングは基礎能力の補完に過ぎず、GPT Image 2 がさらに驚異的なのは、その「世界の知識」の厚みだ。
ここ数日で GPT Image 2 のリーク情報として爆発的に拡散された画像群、例えばイーロン・マスクが抖音(TikTok 中国版)でライブ配信しながら老干媽(ラー油)を購入するものや、サム・アルトマンが同プラットフォームで競合他社と対決するものなどは、すべて GPT Image 2 の強力なテキストレンダリング能力と世界知識に基づいている。
「世界の知識」という概念は、Nano Banana が一世を風靡した頃から注目され始めたが、これは画像生成モデルが汎用 AI モデルと同様の知識を持ち、インターネット検索が可能で、思考でき、我々が日々見ている画面、プレイしているゲーム、視聴しているライブ配信が実際にどのような見た目をしているかを本当に理解していることを意味する。
我々は試しに、インターネットの文化を色濃く反映したあるシナリオを入力してみた。
プロンプト:抖音(Douyin)でライブ配信を行う美しい女性ストリーマー
生成された画像には人物が描かれているだけでなく、さらに恐ろしいことに抖音の UI インターフェースが完全に再現されていた。左下のコメント欄、右側の「いいね」や共有ボタン、上部の視聴者数やスクロールするテキスト(速報)など、すべてのインタラクション要素の階層構造が論理的に正しい。
ゲーマーであれば、その凄まじさはより深く理解できるだろう。『リーグ・オブレジェンド』のチーム戦の場面を再現するよう指示すると、峡谷の地形を描いただけでなく、ヒーローの頭上にある HP バー、スキルのエフェクトによる光の表現、ミニマップの UI フレームに至るまで完璧に再現していた。
プロンプト:リーグ・オブレジェンドのゲーム画面、サモナーズリフトのマップ、古典的なアイソメトリック(等角)俯瞰視点、数人のヒーローが激しいチーム戦を繰り広げている
ハイテク業界の歴史的瞬間でさえ、お手の物だ。一言の指示で、サム・アルトマンの顔の特徴、OpenAI 特有のミニマルなステージ照明、そしてビデオプレーヤーの枠に収められたライブ配信画面までもが正確に再現される。
プロンプト:GPT Image 2 発表会のライブ配信画面。サム・アルトマンを含むこと
GPT Image 2 による、このデジタル世界の視覚的規律の掌握度は、我々の想像を遥かに超えている。
「XX は死んだ」:デザイン、マーケティング、広告を再び根底から覆す
技術の急速な進歩の裏側では、古いワークフローの終焉が訪れている。
AI がテキストと UI の敷居を越えた今、画像生成はもはや「芸術的創造」の域を完全に抜け出し、ハードコアなビジネスの生産性ツールへと変貌した。今回の実証テストにおいて、GPT Image 2 のビジネスへの実装能力は、多くのデザイナーを震撼させるのに十分なものだ。
工業製品やプロダクトデザインの分野では、複雑な機械構造のモデリングに膨大な時間を要していたが、今やそれは数秒で済む。
プロンプト:「張雪機車」のバイクのための、クールな製品分解図をデザインする
浮遊する部品の配置、サイバーパンク的な光の表現。かつて 3D モデラーが数日間かけて取り組んでいたような画像を、この AI は瞬時に高品質なプロトタイプとして提示する。
画像提供:X@hx831126
E コマースや広告ビジュアルの分野でも、Apple のような冷徹で高級感のある質感や、E コマースプラットフォームが求める高彩度で中国語のセールスコピーを添えた「ネット感覚」あふれる画像まで、何でもこなす。
プロンプト:iPhone 16 Pro Max のハイエンド商業広告
プロンプト:製品広告写真。浮き輪。魅力的で、多くのクリック率が見込めるもの。アスペクト比 16:9。中国語を使用。
広報や IP クリエイションの分野でも、GPT Image 2 のレイアウト論理と特徴抽出能力は際立っている。中国語フォントの組版はそのまま実用に耐え、絵コンテの論理も明確で、主要な AI モデル各社のロゴの特徴さえも、ネットのトレンドを押さえた IP 展開へと昇華させてしまう。
プロンプト:映画『セービング・プラン(原題:The Fall Guy 等、または架空のタイトルと解釈)』のための横長ポスターをデザイン(※注:AI はライアン・ゴズリング主演の『フォール・ガイ』を正確には知らなかったようだが、選ばれた俳優たちは確かに大作映画の常連たちだ)
プロンプト:古典的なコミックブックの 1 ページ。コマ割り、キャラクターのダイナミックな動き、吹き出しを含むこと
プロンプト:一連の異なる AI 大規模言語モデル(Gemini、DeepSeek、ChatGPT、Claude、Grok など)のスタンプ(メン 絵)をデザインする
かつてデザイナーは、要件をすり合わせるために様々な参考資料を探し、複雑なデザインフレームワークを構築し、レイアウトや文字修正に追われていた。しかし今や、明確でシンプルなプロンプトを 1 つ入力するだけで、ビジネス提案、E コマースへの広告出稿、あるいはそのまま公開できる完成品が出来上がってしまう。
我々のテスト過程において、Plus アカウント、無料アカウントのいずれでも GPT Image 2 は利用可能となっている。各自の ChatGPT のダイアログボックスで試すことができる。
ただし、現状ではレート制限の表示が出ることがある。頻繁にプロンプトを送信して ChatGPT に生成を求めると、エラーコードを含むメッセージ「画像の生成速度が速すぎます。全ユーザーに最高の体験を保証するため、レート制限を設けています。13 分後に再度生成してください」といった回答が返されることがある。
言わざるを得ないのは、OpenAI の進化が停滞したかと思わせるたびに、同社は我々の油断を突いて新たな切り札を切り出してくるということだ。
ここ数ヶ月、外部からは新モデルのリリースが「歯磨き(※:少しずつしか進まないことの比喩)」のようだとか、Sora がクローズされた、あるいは ChatGPT Atlas ブラウザが不発に終わったなど、かつての AI 覇者もついに衰えたと囁く声も上がっていた。
しかし、今日の GPT Image 2 の登場は、そうした悲観論に対して力強い回答をもたらしたと言えるだろう。
あるモデルが数学の試験用紙を本物そっくりに生成し、抖音のライブ配信画面を完全に再現できるとなれば、「これは AI が作ったものだ」と一目で見抜くことは、もはや不可能に近い。
「画像こそが真実である」時代は、もはや二度と戻ってこないのだ。
我々は現在、仲間を募集しています
📮 履歴書送付先メールアドレス
hr@ifanr.com
✉️ メール件名
「氏名+希望職種名」(履歴書にプロジェクト/作品、または関連リンクを必ず添付してください)