专栏名称: AIGC开放社区
专注AIGC(生成式人工智能)领域的专业社区,关注GPT-4、百度文心一言、华为盘古等大语言模型(LLM)的发展应用和落地,以及国内LLM的发展和市场研究,社区秉承共建、共享、开放的理念,提供对社区会员有价值的商业化思路和服务。
目录
相关文章推荐
FM1031济南交通广播  ·  济南增加一座“巨型充电宝”!鹊山电化学独立储 ... ·  10 小时前  
FM1031济南交通广播  ·  济南增加一座“巨型充电宝”!鹊山电化学独立储 ... ·  10 小时前  
奔腾融媒 新闻天天看  ·  戴口罩!戴口罩!呼和浩特市流感已进入高发期 ·  3 天前  
Duncan艺术菌  ·  Shawn ... ·  3 天前  
Duncan艺术菌  ·  Shawn ... ·  3 天前  
51好读  ›  专栏  ›  AIGC开放社区

SD3.5官方教程:5大重要框架,教你用文本生成精准图片

AIGC开放社区  · 公众号  · 设计 科技自媒体  · 2025-01-04 05:16

主要观点总结

本文关注AIGC领域的大语言模型(LLM)发展和应用落地,特别是SD3.5等文生图模型的使用。文章详细解读了如何通过最贴切的文本提示词来生成精准的图片,包括确定图片风格、主体和动作、构图和框架、照明和颜色,以及技术参数设置等方面。文章素材来源于SD官网。

关键观点总结

关键观点1: 文章主要介绍了如何通过文本提示词生成精准图片的方法。

包括确定图片风格、主体和动作、构图和框架、照明和颜色以及技术参数设置等方面。

关键观点2: 文章关注了AIGC领域的大语言模型(LLM)的发展和应用落地。

特别是SD3.5等文生图模型的使用,提供了使用这些模型的指导和建议。

关键观点3: 文章提供了丰富的文本提示案例。

这些案例展示了如何运用不同的文本提示词来生成具有不同风格和效果的图片。


正文

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!

很多小伙伴在使用SD3.5、DALL·E 3、Midjourney、豆包等文生图模型时,总是感觉生成的图片和预期的相差甚远。

今天就用Stability.ai发布的SD3.5官方教程为大家解读一下,如何用最贴切的文本提示词来生成精准的图片。

确定你的图片风格

风格在图像创作中起着决定性的引领作用,明确了图像整体的审美走向。若倾向于插画风格,画面可能会呈现出鲜明的绘画笔触与丰富的色彩层次,具有较强的艺术表现力;

绘画媒介方面,如水彩会带来清新、透明且晕染自然的视觉感受,油画则以其厚重的质感与细腻的色彩过渡令人瞩目;

数字艺术风格能展现出科技感与奇幻元素的融合,充满无限创意;摄影风格则可营造出逼真的场景还原度。

尝试混合风格更是能碰撞出奇妙的火花,比如线条艺术可赋予图像简洁而富有张力的轮廓,如一幅以线条勾勒的城市夜景,硬朗的线条描绘出高楼大厦的轮廓,在黑暗背景下凸显出城市的冷峻与现代感。水彩风格能为画面增添柔和与灵动,像是一幅描绘春日花园的水彩画,淡雅的色彩晕染出花朵的娇艳与草地的青葱。

文本提示词案例:融合了浮世绘的细腻线条与西方印象派色彩的插画风格,背景是一幅以柔和水彩描绘的樱花林,前景则是一个穿着传统和服站立的人物,采用油画质感来突出主体。

主体和动作

当图像存在主体时,在提示词中首先突出主体的存在是极为关键的,这能让模型迅速聚焦于核心元素,随后描述主体的动作则可赋予图像动态感与故事性。

例如 “一只灵动的孔雀在花园中悠然开屏”,这里 “一只灵动的孔雀” 明确了主体,而 “在花园中悠然开屏” 则展现了孔雀的动作,生成的图像可能是孔雀站在繁花似锦的花园中央,绚丽的羽毛缓缓展开,形成一个五彩斑斓的扇形,阳光洒在羽毛上折射出迷人的光彩。

文本提示案例:一位芭蕾舞者在舞台上跳跃,她的裙子随着旋转飘扬,周围环绕着闪烁的舞台灯光。舞者的表情专注而优雅,仿佛时间在这一刻静止。

构图和框架

通过对构图和框架的精准描述,可以引导图像呈现出特定的视觉效果。若指定特写镜头,能够将观众的注意力紧紧吸引在主体的细节之处,比如 “特写镜头下一颗晶莹剔透的露珠在花瓣边缘摇摇欲坠”,生成的画面会着重展现露珠的圆润形态、内部折射的光线以及花瓣的细微纹理,露珠仿佛即将滑落,给人一种静谧且精致的美感。

而广角视图则能展现出宏大的场景,例如 “广角视图中的古老城堡矗立在云雾缭绕的山脉之巅”,图像中城堡雄伟壮观,山脉绵延起伏,云雾在其间缭绕,营造出一种神秘而宏大的氛围。

文本提示案例:从地面仰望拍摄的特写镜头,焦点集中在一只栖息在古老橡树上的猫头鹰,它的羽毛清晰可见。背景是模糊的夜空,星星点点,营造出神秘氛围。

照明和颜色

利用诸如 “逆光”“硬边光”“动态阴影” 等专业术语来描绘场景中的照明或阴影,能够极大地丰富图像的层次感与氛围感。“逆光” 可营造出神圣而神秘的效果,比如 “逆光中的天使展开洁白的羽翼”,画面中天使背对着明亮的光源,羽翼边缘被光线勾勒出金色的轮廓,身体则处于相对较暗的区域,形成强烈的明暗对比,凸显出天使的圣洁与超凡脱俗。

“硬边光” 能塑造出硬朗、鲜明的视觉效果,例如 “硬边光下的拳击手在赛场上蓄势待发”,光线从一侧直射,在拳击手的面部和身体上形成清晰的明暗分界线,肌肉的线条和坚毅的表情被清晰地刻画出来。

“动态阴影” 则可增加画面的动感与立体感,像是 “在斑驳的动态阴影中舞者翩翩起舞”,随着舞者的舞动,周围树木投射下的阴影不断变化,与舞者的身姿相互交织,形成一幅富有节奏感的画面。

文本生成提示案例:清晨的阳光穿过窗户,形成强烈的逆光效果,在房间内投射出长长的影子。画面以暖色调为主,墙壁呈现出淡淡的橙黄色,地板上散布着金色的光斑。

技术参数设置

使用电影术语来指定技术参数,有助于精确地把控图像的视角与框架。“鸟瞰视角” 能够提供一种宏观的、俯瞰全局的视野,例如 “鸟瞰视角下的城市交通网络如脉络般纵横交错”,生成的图像会呈现出城市高楼大厦间道路的布局,车辆如蚂蚁般在道路上穿梭,展现出城市的繁忙与有序。

“特写” 可聚焦细节,如 “特写一颗古老的树桩上岁月留下的纹理”,图像会将树桩的纹理清晰地放大,展现出其历经风雨后的沧桑质感。

“摇臂镜头” 能营造出灵动且富有变化的视觉感受,比如 “摇臂镜头跟随滑板少年在街头巷尾穿梭”,画面会模拟摇臂拍摄的效果,随着滑板少年的移动,视角不断变化,街道两旁的建筑和人群快速掠过,给人一种身临其境的动感。

“广角镜头” 则可收纳更多的场景元素,例如 “广角镜头中的海边落日余晖洒在金色的沙滩上”,图像中广阔的沙滩、浩瀚的大海以及天边绚丽的落日都能被完整地呈现,营造出一种开阔而浪漫的氛围。

文本提示案例:采用鸟瞰视角,从天空向下看一座繁华的城市夜景,街道灯火通明,车流不息,霓虹灯牌闪烁,给人一种现代都市的活力感。

本文素材来源SD官网,如有侵权请联系删除

END