邯郸pvc管道管件胶 百度又开源!消费GPU可跑,文字渲染能力对标Nano Banana
2026-06-02 22:27:41 77

智东西邯郸pvc管道管件胶
作者 | 陈佳 编辑 | 程茜智东西4月15日报道,今日,百度文心大模型团队正式开源文生图模型ERNIE-Image,其参数规模仅8B,可在显存24GB的消费GPU上运行。该模型在GenEval、OneIG等多项基准上综得分位居开源模型,尤其在文字渲染能力上,与Nano Banana等商业闭源模型同处梯队。
奥力斯 保温护角专用胶批发 联系人:王经理 手机:13903175735(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区
同步开源的还有ERNIE-Image-Turbo版本,其理步数从标准版的50步压缩至8步。
两款模型的权重与理代码已全部上传至Hugging Face,遵循Apache 2.0协议,ComfyUI工作流模板也已同步上线,开源量化案由模型加速工具链Unsloth作提供GGUF格式支持。
ERNIE-Image采用单流DiT架构,并内置提示词增强(Prompt Enhancer)模块,可将简短输入自动扩展为结构化描述再进行生成,提升指令理解与细节控制能力。
▲百度ERNIE-Image开源代码仓库页面,并已获得78颗星(图源:GitHub)
智东西用六组提示词对该模型Turbo版本进行了实测,从实际体验来看,ERNIE-Image-Turbo在处理复杂画面时表现稳定,比如多物体按照提示词要求摆放、图表生成、光影果这些的任务基本都能做到位,但涉及复杂文字、多语言内容或人物关系这种精细的要求,就容易出现写错字或理解偏差的问题。
技术Blog:https://ernie.baidu.com/blog/zh/posts/ernie-image/
体验平台:https://aistudio.baidu.com/ernieimage
Hugging Face:
https://huggingface.co/baidu/ERNIE-Imagehttps://huggingface.co/baidu/ERNIE-Image-Turbo、六组难Prompt实测,多主体与图表生成表现良好我们用六组提示词对ERNIE-Image-Turbo做了测试,覆盖密度多语言文字渲染、多语言混排、漫画分镜叙事、数据图表生成、多主体空间控制和光影人像六个维度。六组全部单次生成,未经重试筛选,所有图均为原图直出。
整体感受是,该模型多主体空间关系控制、数据图表生成和光影细节这几项能力表现不错,但碰到复杂度文字渲染,踩坑比预期要明显。
1、生僻汉字渲染,“鬱”字没能过关
组想看的是,这个模型能不能在图像里准确写出笔画复杂的生僻字,尤其是形近字。
该模型在宣纸水墨背景、楷体风格与红 “文心” 印章这些视觉氛围营造上均到位。
但在文字精确生成上存在明显失误,我们指定的行是“鬱鬱蔥蔥”(yù yù cōng cōng),生成出来变成了“糲糲萬蕙”,不是同个字。三行的生僻字“赢麟龑靐”(yíng lín yǎn bìng),生成结果是“赢麟頃䫧”,“龑”和“靐”这两个复杂度字直接被换掉了。三行里只有二行“薛蟠贾雨村”字形结构没有问题。
2、中英日韩四语混排,英文丢了个字母
中英日韩四语混排测试里,整体呈现和提示词要求基本对得上,版式、风格没什么大问题。但仔细看会发现,二行的“Knowledge”明显少写了个字母“e”,四行的韩文也和指定的“지식에는 경계가 없다”有出入。
我们随后加大了难度,要求该模型把四种语言以小字号清晰呈现、笔画锯齿、严格网格对齐。结果图里出现了乱码、字符变形和内容篡改,多处文字直接法识别,指定的技术参数和评测数据没有个完整出来。
3、漫画分镜实测,角搞反了
这组测试同时考三件事:多面板布局、角跨格致、气泡里的文字渲染邯郸pvc管道管件胶。
生成图片的布局和风格表现不错,两行三列的均等分镜结构完整,格间分隔清晰,角外观在六格之间保持了致。但剧情出了岔子,二格设定的是学生举手提问,气泡内容是“老师,这是什么意思?”,生成出来变成了教授举手,气泡也跟着配在了教授身上,互动主体反了。该模型在语义上出了理解偏差。
4、生成数据图表,细节基本准确到位
这组测的是能不能该模型按指令生成结构严谨的表格和可视化图,数字和标签准不准。
这组表现比预期好。表头“模型名称”“参数量”“GenEval得分”清晰误,填入的模型名称、8B参数量,以及0.8856、0.8667等具体得分都没有遗漏或改错。右栏条形图的配规则也严格执行了,橙亮ERNIE-Image (w/o PE),蓝呈现其余模型,Y轴的0.75到0.95区间准确,条形顶部数值标注和表格致。唯的小瑕疵是X轴二个模型名称漏掉了“Turbo”。
5、七件物品测多主体空间控制,位置关系对得很准
这组测试要求该模型严格控制七个物品的位置、尺寸、遮挡关系,在张写实俯拍桌面照里把它们放对地。
这是六组里让人满意的组,七个指定物品全部按要求出现,且核心位置关系没有乱:翻开的精装书在画面正中,左页手写批注“此处存疑”、右页英文印刷句都清晰可读;黑细框眼镜压在书本左上角;白陶瓷咖啡杯在书本右侧,心形拉花形态自然;元人民币硬币在咖啡杯右侧;黄便利贴贴于书本正下,手写“deadline:4月20日”内容准确;钢笔放在桌面左下角,笔朝向书本,万能胶生产厂家全程人物入镜。空间逻辑自洽,没有出现物品叠错或位置串行的情况。
6、伦勃朗布光,光影执行到位
后组想测的是,在给出度具体的光影、材质和彩指令后,该模型会不会自行简化内容。
结果是,该模型严格执行了指令:画面采用伦勃朗布光,主光来自左上45度角,右侧脸颊的三角形光斑清晰可辨,轮廓规整;右侧补光,仅靠少量环境反光勾出轮廓;背景纯黑,纹理;肤质写实,毛孔可见,磨皮痕迹;毛衣口处的编织纹理也出来了。
二、基准评测成绩单,文字渲染在开源模型里拿百度在三个公开基准上对ERNIE-Image进行了系统评测,分别是衡量通用图像生成能力的GenEval、覆盖中英文双语场景的OneIG,以及门测试密度文字渲染的LongText-Bench。
在衡量通用图像生成能力的GenEval测试中,ERNIE-Image(不启用PE)综得分为0.8856,在所有参测模型中排名,过Qwen-Image(0.8683)和FLUX.2-klein-9B(0.8481)。
▲GenEval业文生图模型评测基准(图源:百度ERNIE-Image技术报告)
OneIG英文榜上,ERNIE-Image开启PE后综得分0.5750,仅次于Nano Banana 2.0(0.5780)和Seedream 4.5(0.5760),位列三,同时在理维度单项排名(0.3566)。
▲OneIG-EN,评估文生图模型在英文提示词场景下综生成能力的量化评测体系(图源:百度ERNIE-Image技术报告)
中文榜上,ERNIE-Image开启PE的综得分为0.5543,同样位列前两名仅次于Nano Banana 2.0,还在多样维度上跑出了0.2478的分。
▲OneIG-ZW,评估文生图模型在中文提示词场景下综生成能力的量化评测体系(图源:百度ERNIE-Image技术报告)
文字渲染项LongText-Bench是能体现ERNIE-Image差异化能力的榜单。英文维度上,ERNIE-Image开启PE得分0.9804,中文维度0.9661,综均分0.9733,在所有开源模型中排名。对比来看,Nano Banana 2.0综均分0.9650,Qwen-Image为0.9445,Z-Image为0.9355。
▲LongText-Bench,业文生图长文本评测基准(图源:百度ERNIE-Image技术报告)
三、架构轻量、部署门槛低,8B参数跑进商用模型射程ERNIE-Image的核心架构是单流Diffusion Transformer(DiT),并内置个轻量提示词增强器Prompt Enhancer(PE)模块,负责将用户的简短文字输入自动扩展为丰富、结构化的详细描述,再送入DiT主干生成图像。
该模型的参数规模仅8B,这在开源文生图域属于中小体量,但百度称在参数率优化上做了大量工作,使运行门槛降至24GB显存的消费GPU,显著低于此前同精度水平模型的部署要求。对照部分大参数开源模型的运行需求,ERNIE-Image这设计的意义在于,个人创作者和中小团队需购置业工作站即可本地部署。
两个模型版本在调用式上有所区别:标准版ERNIE-Image理步数为50步,CFG(分类器自由引)值为4.0;Turbo版由DMD和强化学习联优化,理步数降至8步,CFG降至1.0,牺牲少量精度换取速度提升。
在工程部署上,百度同时提供了两种集成案。种是通过Hugging Face的diffusers库直接调用,只需几行Python代码即可完成理;二种是通过理框架SGLang部署服务端,并支持将PE模块单剥离,用vLLM单运行以加快提示词扩展速度,DiT主干与PE各占立端口,适对延迟敏感的线上场景。此外,AI-Toolkit已支持对ERNIE-Image进行微调训练,为有个化需求的开发者提供了完整的训练-理链路。
结语:文生图再进阶,从“能出图”走向“可控生成”如果把文生图模型的发展拆开看,过去段时间的进步主要集中在“画得像”,但在复杂结构控制、规则执行和文本表达上直不稳定。
此次ERNIE-Image的实测结果显示,多主体位置关系、图表结构、分镜布局和光影条件这类“强约束任务”已经可以较稳定完成。未来,谁能先解决文本与语义致问题,谁才有可能真正进入设计、内容生产等要求场景。
相关词条:不锈钢保温 塑料管材设备 预应力钢绞线 玻璃棉板厂家 pvc管道管件胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》邯郸pvc管道管件胶,以此来变相勒索商家索要赔偿的违法恶意行为。
联系奥力斯
热点资讯
-
1.赣州护角胶 吉利星i-HEV智擎混动双车上市 限时售价9.6
- 1

- 赣州护角胶 吉利星i-HEV智擎混动双车上市 限时售价9.6
- 2026-05-01
- 1
-
2.贺州pvc管道胶水 《Pokémon Pokopia》完成全
- 2

- 贺州pvc管道胶水 《Pokémon Pokopia》完成全
- 2026-05-20
- 2
-
3.莆田万能胶厂家 记者探访校试验地,新“约定”将绽放北京街头
- 3

- 莆田万能胶厂家 记者探访校试验地,新“约定”将绽放北京街头
- 2026-06-01
- 3
-
4.佳木斯防火门胶 纽约数据中心禁令背后: 分布式力如何破解AI
- 4

- 佳木斯防火门胶 纽约数据中心禁令背后: 分布式力如何破解AI
- 2026-02-18
- 4
-
5.柳州pvc管粘接胶水厂家 16岁拿下MVP!CHBL控卫或被
- 5

- 柳州pvc管粘接胶水厂家 16岁拿下MVP!CHBL控卫或被
- 2026-05-29
- 5
-
6.乐山防火门专用胶厂家 日本渲染所谓“外部威胁”居心叵测
- 6

- 乐山防火门专用胶厂家 日本渲染所谓“外部威胁”居心叵测
- 2026-05-22
- 6
-
7.茂名PVC管道管件粘结胶 涨价!内存条价格翻5倍、手机涨30
- 7

- 茂名PVC管道管件粘结胶 涨价!内存条价格翻5倍、手机涨30
- 2026-03-11
- 7
-
8.白沙泡沫板专用胶厂 2023年十大烂剧终盘点:没有烂只有烂,
- 8

- 白沙泡沫板专用胶厂 2023年十大烂剧终盘点:没有烂只有烂,
- 2026-04-23
- 8
-
9.云浮橡塑专用胶厂家 “你好,上海”全球姐妹机场联展示活动“威
- 9

- 云浮橡塑专用胶厂家 “你好,上海”全球姐妹机场联展示活动“威
- 2026-05-15
- 9
-
10.山南pvc管道管件胶 微创 电生理磁航消融管与密度标测管获欧
- 10

- 山南pvc管道管件胶 微创 电生理磁航消融管与密度标测管获欧
- 2026-02-17
- 10
