上海AI实验室、Meta联合开发开源模型可为人体生成3D空间音频(上海AI实验室联培)

来源：网络　浏览：30次　时间：2023-11-29

11月29日消息:近期上海AI实验室与Meta合作推出的开源模型标志着在3D空间音频领域迈出的一大步。该模型通过处理头戴式麦克风的输入音频信号和分析人体姿态关键点，成功地实现了为人体生成3D空间音频的目标。这一技术突破为虚拟环境的沉浸感和临场感提供了关键支持，弥补了目前学术界和企业在听觉方面的疏漏。

然而，从技术层面看，开发这样的3D空间音频模型并非易事。文章指出，面临着三大技术难题，其中包括音源位置未知、麦克风距离音源较远等挑战。为了解决这些问题，研究人员创新性地构建了多模态融合模式，并引入了身体姿态信息，从而成功消除了声源位置的歧义，实现了正确的空间音频生成。

具体而言，模型包括音频编码器、人体姿态编码器和音频解码器等模块。音频编码器处理头戴式麦克风的输入音频信号，通过时间平移对齐不同身体部位的音源位置，最终得到包含各个可能音源位置信息的音频特征表达。人体姿态编码器则分析人体姿态关键点，生成姿态特征表达，为正确生成三维空间音频提供了重要的提示。

项目地址：https://github.com/facebookresearch/SoundingBodies

尽管该模型在技术上取得了显著进展，成功实现了身临其境的3D音场效果，但研究人员也指出了其局限性。目前，该模型仅适用于渲染人体音，难以处理非自由音场传播环境，且计算量较大，难以在资源受限的消费类设备上部署。这一点对于模型的实际应用和推广提出了一定挑战。

综合而言，上海AI实验室和Meta联合开发的这一开源模型为人体生成3D空间音频开辟了新的可能性，为虚拟现实领域的发展贡献了有力的技术支持。然而，未来仍需进一步优化和拓展，以满足更广泛的应用场景和设备要求。

推荐站点

88分类目录
88分类目录专业提供网站网址免费提交收录,88分类目录是采用开放导航式的网站大全,收录国内外各行业优秀的网站网址,让网站在各大搜索引擎收录快排名靠前。
www.88dir.com
66网站目录
66网站目录是免费收录各行业优秀网站,提供网站分类目录检索,关键字搜索,提交网站即可免费推广,增加外链,提升网站流量。
www.66dir.com
265分类目录
网址目录网站网址大全,收集正规的中文官方网站,用户自主提交网站,265分类目录努力打造互动新颖的网站分类目录导航收录平台
www.265dir.com
YY分类目录
YY分类目录全人工编辑的开放式网站分类目录，收录国内外、各行业优秀网站，旨在为用户提供网站分类目录检索、优秀网站参考、网站推广服务。
www.yydir.com
名人百科网
名人百科网(mrenbaike.net)--为大家提供各行各业的名人资料、资讯、图片等,致力于打造国内专业的名人百科平台！
www.mrenbaike.net
菜鸟教程
菜鸟教程提供了基础编程技术教程。菜鸟教程的 Slogan 为：学的不仅是技术，更是梦想！记住：再牛逼的梦想也抵不住傻逼似的坚持！本站域名为 runoob.com, runoob 为 Running Noob 的缩写，意为：奔跑吧！菜鸟。本站包括了HTML、CSS、Javascript、PHP、C、Python等各种基础编程教程。同时本站中也提供了大量的在线实例，通过实例，您可以更好地学习如何建站。本站致力于推广各种编程语言技.
www.runoob.com
中国社会公益网
陕西省社会公益基金会是经陕西省民政厅批准的公募基金会，下设秘书处、公益项目部、筹款募捐部、宣传策划部、社会活动部、专项基金部、资金管理部、公关联络部、青年志愿者工作委员会、青年志愿者爱心乐团等部门机构
www.cpf.net.cn
CNMO科技新媒体
CNMO=Connect More,致力于通过内容成为人与科技、人与产品、人与品牌、人与服务对接的桥梁,让产业、产品的价值与服务得到专业且有趣的解读和适配,引领用户畅享科技带来的美好生活!
www.cnmo.com
国外主机测评
国外主机测评，国外VPS、云服务器，国外服务器，国外主机的相关优惠信息、商家背景、网络带宽、线路走法、售前和售后技术支持等，是目前最好的一家国外主机评测平台。
www.zhujiceping.com

上海AI实验室、Meta联合开发开源模型 可为人体生成3D空间音频(上海AI实验室联培)

推荐文章

推荐站点

上海AI实验室、Meta联合开发开源模型可为人体生成3D空间音频(上海AI实验室联培)