第八届全国声音与音乐技术会议所感
第八届全国声音与音乐技术会议于年11月05-08日(周四-周日)在山西太原召开。本次会议由上海计算机音乐协会、北京声学学会、上海市人工智能学会、上海市计算机学会联合主办,中北大学承办。本次会议致力于加强合作与交流,促进文理交融,推动我国声音与音乐技术领域的发展,共商我国未来声音与音乐技术产业的发展大计。为促进相关学科的交流,推动与会机构在科研、学术、教学、人才培养等方面的互相合作,年第八届全国声音与音乐技术会议邀请全国相关领域的各界代表共同参与。
年,由复旦大学、清华大学相关教授联合创办的第一届全国声音与音乐计算研讨会(CSMCW)在复旦大学召开。其后,年与年的研讨会分别由清华大学与上海音乐学院承办。年第四届会议由南京邮电大学承办,并更名为声音与音乐技术会议(ConferenceonSoundandMusicTechnology,CSMT)。同时,首次在CSMCW/CSMT历史上发表会议论文集,由复旦学报(自然科学版)正式出版。年第五届会议由苏州大学与UCLA苏州先进技术研究院联合承办,同时作为第18届国际音乐信息检索会议(ISMIR)的卫星会议。年第六届会议由厦门理工学院举办。年第七届会议由哈尔滨工业大学承办。在历届会议上,来自包括清华大学、北京大学、复旦大学、上海交通大学、浙江大学、天津大学、哈尔滨工业大学、吉林大学、中国音乐学院、上海音乐学院、上海电影学院、中国科学院、美国斯坦福大学音乐与声学计算机研究中心(CCRMA)、加州大学伯克利分校新音乐与音频技术中心(CNMAT)、西班牙庞培法布拉大学音乐技术小组(MTG)、英国伦敦玛丽女王大学数字音乐中心(C4DM)、加拿大麦吉尔大学音乐与媒体技术跨学科研究中心(CIRMMT),法国里昂国立音乐创作中心(GRAME)等数十所国内外高校和研究机构的教授和学生,以及百度、腾讯、阿里巴巴、杜比、酷狗、唱吧、华为、网易等多家公司的企业研究者参加了会议。
声音,人类对于自身拥有其极为重要的一种感官感知的描述符号,其引导了众多对于我们自身以及外部系统的无止探索,语言学,语音学,物理声学,心理声学,建筑声学,声学仿真,声镊技术在微纳米尺度下实现对颗粒的精确操控,频谱音乐,和声学,声子晶体,光学模声子,声纳,磁弹性耦合,声学整流器……
笔者于此次全国声音与音乐技术会议关于音乐声学研究(musicalacousticsresearch)、空间声技术概述与展望、虚拟声学-如何让声音变得更真实?、21世纪音乐理论教学的自动化(AutomatingMusicTheoryInstructionforthe21stCentury)、基于卷积神经网络的不同病理的鼾声分类、基于神经认知科学方法的音乐对情绪诱发的机制研究综述的相关感受作以下分述。
会议的各主题差异性极大,涵盖从理论、实验、仿真、脑科学、医学、心理学、数据科学、和声学,但真正与艺术创作所相关的为0,基于第一场会议《音乐声学研究(musicalacousticsresearch)》所述针对乐器模型的构建与性能研究,通过有限元模拟与激光多普勒测振仪(LaserDopplervibrometer)和微型力锤去测量小提琴与吉他的码桥为乐器进行测绘与高精度建模以完成实时声音合成模型的使用;
▲
激光多普勒测振仪原理图
▲
报告团队所作实验图景(世界上唯一没有被演奏过的斯特拉迪瓦里小提琴“弥赛亚[Messiah]”)
而使用格子玻尔兹曼法(LatticeBoltzmannmethods[LBM])可以对木管乐器进行流体动力学(Fluiddynamics)的模型建立(ps:空气是一种流体)同时对笛头进行3D参数建模,推导一维模型下的三维有限元建模,测量笛头方向的压力弹性与分布,利用热线风速仪(hotwireanemometer)测量笛头内部湍流,测量笛头出口流速分布,以明确解释非对称几何形状与湍流行为拓展至三维LBM模型,而其中涉及到的便是固体结构-声场-流场的耦合问题,通过对相关的问题进行研究可以解决乐器的数字建模问题。
▲
湍流示意
▲
萨克斯吹奏口模型
▲
测量的装置
这份研究同时让我联想到相关研究的便是IRCAM所开发的Modalys,是IRCAM的旗舰物理模型声音合成环境,用于从基本物理对象(如弦、板、管、膜、拨片、弓或锤子)创建虚拟乐器。
Modalys本身一直是连接到接口的计算引擎,该接口使用户可以对乐器制造和设计环境进行灵活的高级控制。最初,Modalys使用使用Scheme编程语言的基于文本的界面。这样,根据用户的需求,可以将编程语言本身用于有用的数学计算以及更复杂的编程例程,以进行特定的综合。如今,也可以使用多种界面来访问Modalys计算引擎:基于文本的Lisp和MatLab界面,以及使用OpenMusic和Max/MSP可用的图形界面。
▲
ModalysinMax/Mspフランス国立音響音楽研究所(Clarinet)
在计算机音乐中,物理模型合成方法一直是获得声音质量的好方法,而这些质量很难通过标准声音合成方法(例如加法,减法或调频)或通过操纵样本来产生。
声波是人体机械或声学振动的结果。振动是由外部能量产生的,外部能量将能量注入内部,例如锤子撞击膜片或空气流动扰乱管道。通常将物体的能源称为“激励器”,将振动的物体称为“谐振器”。两个对象之间的耦合类型称为“交互”。
大多数类型的声音可以分解为两个相对的类别:瞬态声音,其感知特性会随时间快速发展;静态声音,其感知特性会随时间而缓慢发展。由于傅立叶理论为我们提供了强大的分解和生成静态周期信号的方法,因此后一类的声音很容易在计算机上复制。传统的合成方法与傅立叶理论有关,因此适合于产生平稳的声音。不幸的是,傅立叶理论在处理瞬态声音时有一些局限性,因此已经提出了替代方法(滤波噪声和其他非周期性合成方法)作为在该领域生成声音的计算工具。
物理建模程序会生成声音,这些声音是对机器内部表示的振动结构进行数值模拟的结果。特别是该程序可以模拟简单的结构,例如弦,管和板,也可以模拟复杂的结构,例如大提琴琴体或单簧管吹嘴。经典的物理建模技术依赖于空间离散化-换句话说,为了模拟某种结构,计算机将其表示为在空间中均匀分布的一组质量。这种方法的主要问题是表示总是取决于结构的空间特性,因此每个结构都需要一种单独的表示类型。
Modalys程序产生声音的方法称为模态合成。模态合成是模态理论的一种音乐应用,它来自飞机和桥梁制造行业,在该行业中,需要精确模拟外力作用下的振动结构。模态理论的基本结果是,可以通过了解结构的基本振动模式来预测结构对给定外部激励的反应方式。振动的模式定义为当结构在一定频率下受到周期性力的激励而其所有点在该频率下发生共振时所呈现的特定形状。声学的基本原理之一是,结构的任何振动都可以分解为其基本振动模式的叠加(傅里叶级数是也)。模态理论还开发了用于测量给定乐器振动模式的实验方法。与现有的物理建模综合方法相比,模态综合具有两个优点:
?表示方式独立于结构的空间特性。这是特别有用的,因为从一种仪器到另一种仪器的连续过渡会减少模态参数的过渡。
?表示与结构的听觉特征直接相关。模式的共振频率是当用脉冲激励结构时产生的声音的频谱分量。
而于医学所结合的声音技术便是通过人工智能(AI)进行简单有效且具有高置信度的鼾声病理分类,主要为两类,阻塞性睡眠呼吸暂停(Obstructivesleepapnea[OSA])造成的鼾声特征与中枢性睡眠呼吸暂停(Centralsleepapnea[CSA])造成的鼾声特征
阻塞性睡眠呼吸暂停,一般是指每次发作时,口、鼻气流停止流通达10秒或更长时间,并伴有血氧饱和度下降等。成人每晚7小时的睡眠期间,发作次数常达30次以上。从解剖学方面来看,喉上方有3个部分容易发生狭窄、阻塞,气流振动咽部皱襞(如软腭、皱折的粘膜等)及分泌物,形成外围声。这3处为:鼻和鼻咽,口咽和软腭,以及舌根部。亦可见到喉咽狭窄所致者。鼻腔和鼻咽为呼吸道的重要部分。鼻和鼻咽阻塞如鼻中隔偏曲,鼻息肉,鼻甲肿大,鼻腔肿瘤,腺样体肥大和鼻咽肿瘤等常引起OSA发作。老年性变化也是原因之一。老年期组织松弛。近代有些神经生理研究,探讨气道阻塞的咽周围神经肌肉方面的原因。通过对颏舌肌、二腹肌、膈肌等肌电话动的测试,发现在阻塞发作前这些肌肉的肌电活动就出现减弱,由于肌张力减弱,致使咽壁松弛、塌陷而内移,引起打鼾或OSA。
中枢性睡眠呼吸暂停是一种与睡眠有关的疾病,通常间歇性或周期性地持续10-30秒,呼吸的气力减弱或消失,通常与血上静脉血氧饱和度减少有关。CSA通常是由于身体控制呼吸的反馈机制不稳定造成的。中枢神经性睡眠唿吸暂停也可以作为Arnold-Chiari畸形的指标。在纯粹的中枢神经性睡眠呼吸暂停中,大脑的呼吸控制中心,位于被称为前包钦格复合体(pre-Botzinger