400 128 6709

行业新闻

魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话

发布时间:2023-08-19点击次数:

魔搭社区推出了一款名为live portrait的ai视频生成工具,能够通过一键操作使照片中的人物开口说话

阿里云推出了一项名为Live Portrait的数字人视频生成工具,用户只需上传一张照片和一段文本或语音,即可生成一段开口说话的数字人视频。这项工具可应用于视频|直播|、聊天机器人、企业营销等多个场景。目前,该工具已在魔搭社区创空间开放体验

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话

随着自对话大模型和AI绘画模型的风靡,研究界正逐渐将生成式AI的研究推向更多模态的方向,其中AI视频生成技术备受关注。该技术能够将文本或音频等信息转化为面部运动信息,从而生成具有人物形象的动画照片,有效降低了视频拍摄和制作的门槛

阿里云最新上线的Live Portait工具,结合了运动模块和生成模块。该工具采用了阿里云自研的口型预测算法,大幅提高了口型生成的准确度,相较于传统方法有显著提升。在训练阶段,增加了姿态的显式控制,使得生成的视频可以呈现任意动作,无需底板视频,从而大幅提升了数字人说话的真实感。此外,通过眼神主动控制技术,Live Portait可以为眼球增加自然运动,使得生成结果更加接近真人效果。据介绍,Live Portait相关技术已被国际AI顶会CVPR、ICCV等收录

魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话

ChatGPT Writer ChatGPT Writer

免费 Chrome 扩展程序,使用 ChatGPT AI 生成电子邮件和消息。

ChatGPT Writer 106 查看详情 ChatGPT Writer

根据魔搭社区的信息,Live Portait提供了两种方式供用户选择上传照片后,即文本驱动和音频驱动。在文本驱动模式下,用户可以选择28种不同的声音,包括普通话、英语、粤语和童声等。此外,Live Portait还提供了轻量模型选择,以帮助用户更快地生成视频

张邦,该工具算法负责人,表示:“Live Portait整合了团队多项自主研发的创新技术,包括利用单张图片即可生成逼真的面部动画,突破了传统对抗生成网络的限制。随着技术的不断演进,图像生成视频具有广阔的应用前景,有望成为企业提高生产效率、降低成本的重要工具。”

据了解,该团队的研究方向包括数字人、3D模型AI生成、高逼真渲染和自然人机交互等领域,已经在国际顶级会议上发表了50多篇论文

以上就是魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话的详细内容,更多请关注其它相关文章!


# 推出了  # 荔枝营销推广目标是什么  # 中文网  # 相关文章  # 据了解  # 只需  # 已被  # 两种  # 多个  # 粤语  # 一键  # 曲靖营销推广项目公司  # 镇巴网站建设  # 天津网站建设美丽图片  # 黄岛区网站优化工具  # 达人营销推广方案  # 江阴网站建设服务价格  # 甘肃新网站建设贵不贵  # 长沙精准营销推广  # 排名第一抖音关键词优化推广 


相关栏目: 【 行业新闻62819 】 【 科技资讯67470


相关推荐: 彭博社:苹果Vision Pro曾测试VR手柄追踪方案  Adobe旗下Illustrator引入生成式AI工具Firefly  世界人工智能大会中西部县域数字就业中心组团亮相  iPhone两秒出图,目前已知的最快移动端Stable Diffusion模型来了  阿里达摩院发布免费开放100项AI专利许可的动机是什么?  OpenAI更新GPT-4等模型,新增API函数调用,价格最高降75%  基于信息论的校准技术,CML让多模态机器学习更可靠  能走、能飞、能游泳,科学家打造全能 M4 机器人  联想浏览器引入小乐 AI 助手,成功接入百度文心一言大模型,经过实测证实  速途网络成立“人工智能专家委员会”5位中美博士加盟  微幼科技晨检机器人:幼儿园健康保障的新伙伴  AI和ML推动联网设备的增长  IBM将模拟计算用于人工智能,重塑AI计算  中兴通讯无人机高空基站助力北京门头沟受灾乡镇保障应急通信  硅谷人工智能研究院创始人皮埃罗·斯加鲁菲:Transformer模型演讲  中国联通发布图文AI大模型,可实现以文生图、视频剪辑  首部国内AI辅助动画片《魔游纪:人工智能辅助篇》预告发布  人工智能在重症监护室的未来  人工智能在服务优化方面优缺点有哪些  彬州市第三届青少年机器人创新大赛成功举办  V社悄悄封禁使用AI生成美术素材的游戏  马斯克的幽默“现实”:AR眼镜与20美元“增强现实”哪个真实?  WAIC 2025|云深处科技绝影Lite3与X20四足机器人亮相  泗洪:畅通城市“血管” ,管下机器人来帮忙  站在社会的高度理解人工智能  昇思开源社区理事会成立,基于昇思AI框架的全模态大模型“紫东.太初2.0”发布  RoboNeo安装教程  阿里云连续两年进入Gartner云AI开发者“挑战者象限”  "探索Meta发布的Quest MR/VR视频录制与拍摄指南"  探索人工智能和物联网的动态融合  掌阅科技申请阅爱聊商标 掌阅科技申请AI相关商标  “踩油门,也要会踩刹车” 互联网企业高管谈人工智能发展  清华系面壁智能开源中文多模态大模型VisCPM :支持对话文图双向生成,吟诗作画能力惊艳  7条线路感受智慧美好生活,“2025 世界人工智能大会民营企业社会开放日”主题活动启动  生成式AI爆发,亚马逊云科技持续专注创新,助力企业数字化转型  BLIP-2、InstructBLIP稳居前三!十二大模型,十六份榜单,全面测评「多模态大语言模型」  喜马拉雅在国际会议挑战赛中突破语音重叠难题斩获第一 加速AI创新  苹果公司迅速拓展AR/VR团队,Vision Pro发布后7月份增设近100份工作机会  如何对员工进行再培训以充分利用供应链管理中的人工智能创新  微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课  微软向美国政府提供GPT大模型,如何保证安全性?  无人机自主巡检为高海拔输电线路运维添“新彩”  数据科学,解码智能未来——Altair首次提出“Frictionless AI”概念  “上海市民营企业人工智能赋能创新中心”揭牌成立  研究表明 GPT-4 模型具备自我纠错能力,有望推动 AI 代码进一步商业化  传Meta 2025年推出首款AR眼镜,采用军用级别材料,计划生产1000台  新华三集团总裁兼首席执行官于英涛:人工智能时代需要想象力,更需要精耕务实  OpenAI 已全面开放 GPT-3.5 Turbo、DALL-E 及 Whisper API  一次购买全年省心,入手科沃斯这几台机器人,省下时间就是金钱  吴恩达、Hinton最新对话!AI不是随机鹦鹉,共识胜过一切,LeCun双手赞成 

400 128 6709
E-mail

contact@tlftec.cn

扫一扫,添加微信

©  云南淘乐房科技有限公司 版权所有  滇ICP备2025071560号  

云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司 云南淘乐房科技有限公司