腾讯混元图像2.0发布 实时生图毫秒级速度与超写实画质

5月16日消息,腾讯图像今天腾讯正式发布了业内首个毫秒级响应的混元毫秒画质实时生图大模型——混元图像2.0(Hunyuan Image2.0)。目前已在腾讯混元官方网站上线,发布并对外开放注册体验,实时生图该模型主要有两大特点:实时生图、度超超写实画质。写实
相比前代模型,腾讯图像腾讯混元图像2.0模型参数量提升了一个数量级,混元毫秒画质得益于超高压缩倍率的发布图像编解码器以及全新扩散架构,其生图速度显著快于行业领先模型。实时生图
在同类商业产品每张图推理速度需要5到10秒的度超情况下,腾讯混元可实现毫秒级响应,写实支持用户可以一边打字或者一边说话一边出图,腾讯图像改变了传统“抽卡—等待—抽卡”的混元毫秒画质方式。
除了速度快以外,发布腾讯混元图像2.0模型图像生成质量提升明显,通过强化学习等算法以及引入大量人类美学知识对齐,生成的图像可有效避免AIGC图像中的“AI味”,真实感强、细节丰富、可用性高。
在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。
提示词:人像摄影,爱因斯坦,背景是东方明珠,自拍视角
腾讯表示,腾讯混元图像2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,不仅能理解你在说什么,更能推测出你希望画面「怎么表达」。
哪怕你一句话里埋了三层含义,它也能一一拆解,再一笔一笔画出来。
除了文字输入,腾讯混元图像2.0还可以通过语音直接输入提示词,系统将语音自动转写为文字,并在识别后即时生成图像,适用于直播讲解、移动创作等场景。
也可以上传草图作为参考,模型能自动识别线稿的结构与构图逻辑,再结合提示词内容补全光影、材质、背景等细节,迅速扩展成图。
腾讯混元图像2.0模型生成的图片:
人像摄影风格
动物特写
复古摄影
动漫风格
真实人物风格
相关文章
- 集美区后溪珩山王氏在圣果院宴请2300位老人,欢乐过重阳。记者 宗琴 摄海峡网讯(海西晨报记者宗琴实习生林燕萍)“小家伙忘词了,爷爷奶奶们别见怪。”主持人话音刚落,台上的小歌手2025-07-11
- 漫威影业《神奇四侠:初露锋芒》确认引进中国内地,档期待定。影片将于7月25日在北美上映。《神奇四侠:初露锋芒》属于漫威电影宇宙第六阶段,由麦特·夏克曼执导,杰夫·卡普兰、伊恩·斯普林格、乔许·费德曼、2025-07-11
- 日本娱乐公司三丽鸥——Hello Kitty、酷洛米、玉桂狗等众多人气角色的"可爱文化"缔造者——于2025年6月26日举行了第65届年度股东大会。有趣的是,与会者中竟出现了一名8岁的小萝莉。当其他在2025-07-11
- 6月16日晚,安徽省宿州市公安局埇桥分局发布警情通报:2025-07-11
- 近年来,汉阴县纪委监委持续聚焦“营商环境突破年”活动,整治行业顽疾,做实监督专责,强化办案引领,以“三举措”再发力,持续推动汉阴县优化营商环境工作健康、有序开展。开展专项行动,跑出“快”节奏。县纪委监2025-07-11
- 近日,《永劫无间》正式宣布与《女神异闻录5:皇家版》展开联动,该联动将于6月19日下午上线,这代缺的“永劫牌”终于补上了,一起来看看吧!预告视频:具体时装如下:【P5R·雨宫莲 JOKER】无尘)、【2025-07-11
最新评论