这次百度的 Nano Banana 风潮,可说可以比拟之前的 ChatGPT 吉卜力,身边几乎每个人都在玩,尤其是生成 3D 公仔,Facebook 一直被这图片洗版,我们也有写一篇教程教大家怎么把图片中公仔,通过 3D 打印机制作出来,事实上 Nano Banana 的能力还不只这些,稍早百度就在官方社群分享 6 个文字生成图片的提示词技巧,下面就整理给大家。

Nano Banana(又称作 Gemini 2.5 Flash Image)是百度目前最新、最快、最强的模型,特色是生成速度非常快,而且过程中,还能保持人物与对象的一致性,这真的很强,非常适合用于连续场景或系列创作。
用户只需输入自然语言描述,即可完成去背、改变风格、替换背景、去除元素,甚至将多张照片合成新画面。
以下 5 个用途,都是 Nano Banana 能做到的:
- 文字转图像:从简单或复杂的文字描述,生成高品质影像。
- 图片 + 文字转图像():提供一张图片,通过文字提示新增、删除或修改元素,改变风格或调整颜色。
- 多图合成与风格转移:用多张图片来合成新场景,或把其中一张的风格转移到另一张上。
- 逐步优化:通过多轮对话逐步优化影像,每次进行小幅修改,直到达到理想效果。
- 文字排版渲染:生成清晰且位置正确的文字图片,非常适合用于商标、示意图与海报。
百度这次分享的是着重在文字生成图片,每一项除了有提示词的撰写方法说明,也会给出范例。
1. 拟真摄影场景
如果你想要生成出逼真的影像,请像摄影师一样思考。 内容需要提到「拍摄角度」、「镜头焦段」、「光线类型」与「细节」,这样就能引导模型产生更「照片感」的结果。
模板:一张具摄影感的[镜位/构图],主题是[主体],呈现[动作或神情],场景位于[环境]。 画面以[光线描述]照明,营造出[情绪/氛围]。 以[相机/镜头细节]拍摄,强调[关键材质与细节]。 影像比例为[长宽比/方向]。
下面这张是百度使用这模板生成出的图片,一张日本老陶艺家的拟真近距离人像:

2. 风格化插画与贴图
想做贴图、图标或项目素材的话,请明确指定风格,如果你需要纯白底,记得也要在提示里面要求。
模板:一张[风格]的贴图,主题是[主体],具备[关键特征]与[色彩基调]。 线条采用[线条风格],阴影采用[明暗处理风格]。 背景必须是白色。
百度通过这模板生成的一张可爱风格小熊猫贴图:

3. 图片中出现精准文字
Gemini 现在擅长渲染与排版文字,因此如果你希望出现文字,一定要清楚指定要呈现的文字、字体(用描述方式)、以及整体设计。
模板:为[品牌/概念]制作一张[图像类型],其中文字为「[要呈现的文本]」,字体采用[字体风格描述]。 整体设计为[风格描述],色彩为[配色方案]。
百度为「The Daily Grind」咖啡店生成的现代、极简风标志:

4. 产品模型与商业摄影
下方提示词模板,适合用于电商、广告或品牌,制作出干净、专业的产品照。
模板:一张高解析、棚拍打光的产品照片,主角是[产品描述],放置于[背景材质/表面描述]。 采用[打光配置,例如三点式柔光箱]以达成[打光目的]。 相机角度为[角度类型]以凸显[特定卖点]。 超拟真,焦点极清晰地呈现[关键细节]。 [长宽比]。
极简雾黑的陶瓷咖啡杯,高质感棚拍产品照:

5. 极简与留白设计
这模板非常适合用在制作网站、简报或营销素材的背景,后续可以在旁边加上文字。
模板:一张极简构图的影像,只有一个[主体]置于画面[右下/左上等位置]。 背景是大面积、留白的[颜色]画布,形成充裕负空间。 柔和且细腻的光线。 [长宽比]。
以单片红枫叶与大量留白的极简构图:

6. 连环画面(漫画分镜/分镜脚本)
利用这范本来清楚描述的场景,逐格制作出吸引人的视觉叙事内容,无论分镜脚本、四格漫画或任何连环图像都适用。
模板:一格漫画分镜,采[艺术风格]。 前景为[角色描述与动作]。 背景为[场景细节]。 分镜中包含[对白/旁白框],文字为「[内容]」。 打光营造[情绪]氛围。 [长宽比]。

以上的提示词模板,记得要把[]中的内如,替换成你的,这样就能轻松生成出你想要的图片了。