微软最近注册了一项新专利,名为“人工智能声音排列模型”。微软正在发明这种AI声音编排技术,为电影、电视剧、游戏甚至现场录制的节目提供音乐和其他声音元素。
专利中提到了游戏的动态瞬间,或者可以根据玩家的动作和场景创作相应的音乐。摘要指出,这项技术可以使用视觉、音频和文本特征和提示(统称为“数据集”)来设置参数,以指示大量AI模型构建音频编曲器。
游戏音乐或将实现千人千面" />
如果这项专利能够实现,每个玩家在游戏中的声音体验将因人而异,很多游戏场景会有不同的声音和音效。
专利描述显示,AIengine可以分析人类的表情和情绪,收集局部数据,分析海量情况。AI可以学习图片、视频、电影、直播事件,并生成一系列音效文件,为不同的图片匹配合适的音效和音乐。如果这项技术成熟,独立电影和游戏的制作成本将进一步降低,大大丰富创作环境。
该技术将通过云计算实现,但何时部署还有待观察。面对如此庞大的数据集,AI系统必然需要强大的设备来支撑。所有玩家现在能做的就是继续等待。