全栈AI技术1:1还原真人形象和声音,为虚拟数智人应用加码

发布时间:2022-10-16 10:49:20 【来源:砍柴网】

  元宇宙概念爆火后,作为现实与元宇宙场景连接的重要“媒介”之一虚拟人以主角身份再次破圈。虚拟主播、虚拟教师、虚拟客服、虚拟导游等各类虚拟人物形象也愈发立体和全面地展示在我们的生活中,虚拟人普适化看似又进了一步。然而,这些倍受追捧的虚拟人多以CG技术加持,低智能的驱动能力、局限的推广应用、高额的造价却让更多受众望而却步。

  今年8月,完成Pre-A轮千万元融资的拓元智慧,利用其全栈AI技术,推出了2D真人复刻服务,并通过在垂直领域创建具备推理和认知能力的数智人大脑,打造出低门槛、可规模化落地的数智人解决方案,为大众用户提供在虚实融合世界的分身和交互中介,使其成为新的连接及生活方式。

  全栈AI技术 1:1还原真人形象和声音

  《2022虚拟人产业发展白皮书》指出,决定2D真人数智人高真实度还原的核心技术是各类驱动算法设计和模型训练,数据训练的质量将决定数智人内容产出的效果。拓元智慧作为一家具备原创领先技术的虚拟数智人技术及应用服务商,在虚拟数智人核心技术领域积极布局、持续创新突破,其核心团队在自监督学习、知识及因果推理、多模态内容生成等关键技术板块积淀了多年深厚的技术基础。

  通过原创的人体及人脸三维重建、语义/情感关联的表情和动作生成、情感化/风格化语音合成等全栈AI技术能力,拓元智慧能根据真人出镜录制的短暂音视频内容,完成人物形象、声音复刻及还原,实现媲美真人的宇宙元分身。

  在形象复刻方面,一是采用人脸三维结构重建模型,训练人物表情、口型和人脸形象,渲染出生动、灵活的脸部肌肉和表情;二是采用肢体三维结构重塑,通过肢体可驱动引擎完成穿着渲染模块和虚实环境交互对齐。在声音合成方面,则是采用高保真多层级语音模型,完成音色、语调和语速的高度还原。

支持 IP定制 满足全领域多场景应用

  传统认知下,形象好、气质佳、普通化标准、音质好的人物才可以复刻出效果好的虚拟数智人,但基于认知AI及数智大脑原理制作数智人的拓元,早已打破这一前提。无论是政府机构、教育培训、MCN机构还是媒体单位,想要复刻的人物是男性、女性、老人还是儿童,拓元复刻技术均能根据不同外形、语音的人物设定复刻出专属他的IP元宇宙分身,并通过复刻而成的分身更换不同风格、不同场景,真正实现“1次复刻、N次分身”,为用户带来差异化营销体验。

  此外,拓元还可提供专业的拍摄流程指导、复刻模型数据解析、个性化推荐等专属客户服务,并为客户隐私安全保驾护航。

  低成本运营 助力企业降本增效

  复刻好了数智人,怎么用呢?早在2019年人民日报社“果果”、新华社“新小微”就告诉了我们答案,虚拟人视频制作可通过SAAS服务、AI云计算及API开放完成。只是高额的制作成本、局限的应用场景,并不被普通受众所接受,大家仍持观望态度。但如今虚拟人已开始席卷国内各大短视频平台,很多刷到的口播短视频账号内容,都是由AI虚拟数智人生成,腾讯、字节跳动、微软等大厂已开放虚拟人制作平台,高成本虚拟人及虚拟人视频制作已是过去式。

  拓元智慧也于近期开放了元分身产品平台,推出了颠覆式的AI黑科技。平台以打造高真实度AI数智分身为核心,通过文本编辑、个性化背景及字幕调整、多情感音色的选择,一键输出多场景多样化口播视频,突破了时空限制,实现了制片循环精简化、人效利用精益化、制作成本低廉化、制作产能规模化四大突破,为视频内容产业提供了元宇宙时代的崭新手段。可帮助自媒体创作者实现高质量文本输出、批量化视频内容生产,快速“养成”优质流量达人,同时还能助力医疗、娱乐、游戏、教育、通信、银行等企事业单位降本增效。

  未来,拓元智慧将继续深耕AI虚拟数智人技术,逐步推动虚拟分身和元宇宙的普及化。

  关于拓元智慧

  拓元(广州)智慧科技有限公司(X-Era AI),简称“拓元智慧”,是一家具备原创领先技术的虚拟数智人技术及应用服务商。团队核心成员来自阿里、商汤、 Oxford、CMU、中山大学等知名企业,拥有多年的顶尖技术专家 AI工程化与业务落地经验。

  拓元智慧拥有300多项技术成果,在国际顶级期刊/会议上累计发表学术论文300余篇,在数十项主流AI竞赛或者评测基准中获得冠军,十余次获得学术期刊及会议的最佳/优秀论文奖,获得中国图像图形学会科学技术一等奖、吴文俊人工智能自然科学奖、省部级自然科学奖等。

RPA行业“百花齐放”:AI是最强有力的发动机
重视数据安全保护,推动产业实现健康可持续的高质量发展
5G行业应用茁壮发展,赋能数字智能转型发展
面向行业关键场景,卡奥斯5G助力中国制造转型数字领航
深入解读下一代互联网带来的变革、挑战和机遇
中国云厂商跨海:从中国市场“内卷”,到东南亚“外卷”
大有所用的生物计算机:利用DNA进行数据存储
Web 2血条在倒计时,互联网还能卷出什么新花样?
[ 最新资讯 ]

全栈AI技术1:1还原真人形象和声音,为虚拟数智人应用加码

元宇宙概念爆火后,作为现实与元宇宙场景连接的重要“媒介”之一虚拟人以主角身份再次破圈。...

搭载分子级保鲜科技和GP+光电超净技术,TCL让你餐餐吃得都新鲜

  想了解一个人,不如先看看他的冰箱。 ...

探讨 | AI对于传统科研究竟意味着什么,最终会带来哪些改变?

  用 AI 模拟微观世界,跨尺度理解物理现象。 ...

谷歌首款Pixel手表问世!网友调侃:对标苹果手表的“安卓之父”来了!

谷歌虽是软件大户,但对硬件的执着有目共睹。...

中国袋泡茶品牌成功上位,茶里入选广州未来独角兽创新企业

相比传统的散装茶叶,袋泡茶(又称茶包)具有携带便捷、冲泡方便、处理简单等特点。...

馋嘴猴解锁场景营销新模式,形成强大品牌引爆能力

近日,馋嘴猴卤味全新广告片登陆分众传媒,重磅发力楼宇电梯广告。...