拿下世界第一,中国AI大模型创下一纪录 | |
www.wforum.com | 2025-05-16 14:59:39 中时新闻网 | 0条评论 | 查看/发表评论![]() |
![]() |
![]() |
|
|
|
中国大陆网络巨头腾讯16日正式发布AI业内首个毫秒级回应的即时生图大模型——混元图像2.0(Hunyuan Image2.0),此一即时生图大模型已在在腾讯混元官方网站上线,并对外开放注册体验。该模型主要有2大特点:即时生图、超写实画质。 据《快科技》报道,腾讯混元图像2.0相比前代模型,其参数量提升了一个数量级,得益于超高压缩倍率的图像转码器以及全新扩散架构,其生图速度显著快于行业领先模型。 报道指出,在同类商业产品每张图推理速度需要5到10秒的情况下,腾讯混元可实现“毫秒级”回应,支持用户可以一边打字或者一边说话一边出图,改变了传统“抽卡—等待—抽卡”的方式。 除了速度快以外,腾讯混元图像2.0模型图像生成品质提升明显,通过强化学习等演算法以及引入大量人类美学知识对齐,生成的图像可有效避免AIGC图像中的“AI味”,真实感强、细节丰富、可用性高。 在图像生成领域专门测试模型复杂文本指令理解与生成能力的评估基准GenEval(Geneval Bench)上,腾讯混元图像2.0模型准确率超过95%,远超其他同类模型。 腾讯表示,腾讯混元图像2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,不仅能理解你在说什么,更能推测出你希望画面“怎么表达”。哪怕你一句话里埋了三层含义,它也能一一拆解,再一笔一笔划出来。 报道说,除了文字输入,腾讯混元图像2.0还可以通过语音直接输入提示词,系统将语音自动转写为文字,并在识别后即时生成图像,适用于直播讲解、移动创作等场景。 也可以上传草图作为参考,模型能自动识别线稿的结构与构图逻辑,再结合提示词内容补全光影、材质、背景等细节,迅速扩展成图。 提示词:“人像摄影,爱因斯坦,背景是东方明珠,自拍视角”在混元图像2.0生成的超写实画质AI图片。(图/腾讯混元AI) |
|
|
|
![]() |
![]() |
巴基斯坦这个举动 印度更是五味杂陈 |
![]() |
刚宣布胜利 印度就对中国和土耳其“拉清单 |
![]() |
巴军称摧毁印军S-400 事实究竟如何? |
![]() |
普京为何不愿放下武器?美乌双簧或逼出真相 |
![]() |
81亿军购订单告急,又一国质疑“阵风” |
![]() |
巴基斯坦这个举动 印度更是五味杂陈 |
![]() |
刚宣布胜利 印度就对中国和土耳其“拉清单 |
![]() |
巴军称摧毁印军S-400 事实究竟如何? |
![]() |
普京为何不愿放下武器?美乌双簧或逼出真相 |
![]() |
81亿军购订单告急,又一国质疑“阵风” |
![]() |
B-2轰炸机,悄悄撤了? |
![]() |
几日空战,暴露了印巴的一个共同困境 |
![]() |
印度全程控场:打节点、断跑道 实现了战役 |
![]() |
邀请J-10C参与巴黎航展 法国人的姿态真够高 |
![]() |
有关中国核动力航母发展和六代机上舰 |