新华社北京7月12日电(记者董瑞丰)从检索图像、描述视频,到吟诗作赋、续写文章,再到识别语音、双语翻译,虚拟人“小初”日前亮相2021世界人工智能大会,展示了图、文、音三种模态的智能转换和生成。
“小初”具备这样的能力,得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发,基于国产化基础软硬件,仅采用一个大模型,即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。
中科院自动化所所长徐波介绍,“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式,多模态大模型将成为不同领域的共性平台技术,是迈向通用人工智能的重要路径探索。
“‘紫东太初’实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。
据了解,中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型,并通过跨模态语义关联,构建了三模态预训练大模型。
*免责声明: 凡本网注明“来源:XXX(非神州瞭望网)”的作品,均转载其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。若内容涉及投资建议,仅供参考勿作为投资依据。本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。
数字经济时代,信息成为经济发展的新资源,算力成为千行百业数字化转型的新动能。从日常刷脸打卡到未来智能汽车发展,再到探寻未知世界我们生活的方方面面在不知不觉中已经和算力紧
2022-03-25
面板供应宽松导致彩电价格下降,消费市场迎来利好。叠加超高清行业的利好和北京冬奥会、卡塔尔世界杯等体育赛事推动,2022年中国彩电市场尺寸、结构、技术加速优化升级。电视品牌坚定
2022-03-24
时隔10年,诸多迹象表明谷歌的AR眼镜项目有可能卷土重来。 2012年,谷歌官宣了拓展现实眼镜项目计划。2015年,发售仅9个月后,短命的Google Project Glass(谷歌眼镜)彻底退出历史舞台;时隔
2022-03-24
新发展格局下,科技创新的重要性越来越突出。今年国务院政府工作报告提出,深入实施创新驱动发展战略,巩固壮大实体经济根基,推进科技创新,促进产业优化升级,突破供给约束堵点,
2022-03-24
随着汽车智能化进程不断推进,其计算平台的算力等级也在直线飙升。如果说L2级汽车自动驾驶所需芯片算力为10TOPS,那么业界普遍预计L3+级算力将达到1000TOPS。提升计算效率已经成为汽车智能
2022-03-24