Meta公司开源六种数据结合多感官人工智能模型

25
okx
Meta公司于5月10日宣布了一个全新的开源人工智能模型ImageBind。这是第一个将六种类型数据结合到一个单一嵌入空间的模型,包括视觉(图像和视频)、热能(红外图像)、文本、音频、深度信息以及最有趣的通过惯性测量单元(IMU)产生的运动读数。目前该模型仅是个研究项目,暂无直接消费者或实际应用,但这也预示了生成性人工智能系统创造沉浸式多感官体验的未来。
数藏交流群
相关问答
进群交流|欧易官网