在天依ACE公测后的一些思考

这篇思考的一些背景(可以跳过)

这几天,我可能是兴奋过头了。

记得八月二十五日的中午十二点左右,我与5331老师共进午餐。在路口,我与取快递的5老师分别。独行在南区公寓前的小径,我掏出了手机,对近期的通知进行阅读。我的手指在这块发光的玻璃上划动着。行至S2宿舍楼前,我看到了有依发给我的一张图片,上面清楚地写着“8.27洛天依ACE1.0与ACE Studio公测开启”。接连着被5老师精湛球技蹂躏了两天的身体重焕新生,我大喊一声,调动了大腿酸痛的肌肉完成了一个跳跃的动作。在此之后,我继续压榨着我的腿部肌肉,使我的双腿能够驱动我的身体迅速移动到我的宿舍。我打开我的电脑,仔细看完了整个宣传视频。这使得我更加兴奋了,我甚至希望有人把我打晕,让我睡到公测的时候。

为了缓解我的过度兴奋,我甚至又主动约5老师打了一个小时的羽毛球。

终于熬到了八月二十七日。我得知公测将于下午两点开启,带着不知道怎样的精神状态,我穿上了只有参加活动才穿上的西装,前往咖啡厅于龟龟进行见面并一同等待这个神圣的时刻。测试开始之前,我甚至爱屋及乌地试用了其他的ACE歌姬。ACE不讲武德,提前了2分钟就开放了公测。这时候,我看见龟龟的Surface屏幕上已经有了天依的图标。不经大脑审查地,我出现了返祖现象,在咖啡厅发出了类人猿才会发出的尖叫声。

时光荏苒,笔者开始写这篇推送时,公测已经过去了十天。在此期间,我使用天依ACE整过许多活,也认真地感受过天依ACE演唱的我的暂未完成的企划,更听到了我的好哥们命里有依发布的天依ACE版本的《枝江》。

遗憾的是,笔者将这篇推送搁置了很久,到2023年初才又打开了这篇推送的草稿。这期间,笔者也有幸从学长那里接到了商单,使用一位ACE歌姬完成了一首歌曲。笔者也与好友讨论了AI调教一些特点。在天依AI公测快半年、言和阿绫AI内测之时,笔者决心完成这篇推送,来谈谈我对AI调教的一些拙见。

她,仿佛通了人性

笔者不才,在此之前,我曾经尝试过多种歌声合成引擎进行调教的尝试,包括但不限于VOCALOID、Synthesizer V。笔者也使用这些引擎做过一些较为完整的翻调作品。但是当我真正使用天依AI之后,我发现,这个引擎会通过云端运算,捕捉词曲中的一些特征,将训练好的歌声模型生成的情感反馈于各种参数之上。也就是说,不同于我之前使用过的Synthesizer V AI,ACE可以完成较为合理的自动调教,作为调教师,我只需要将MIDI导入软件,将歌词填入音符,等待云端的解算,一个可听的、富有感情的声音就会从我的耳机中传出,触动我的耳膜。

天依好像对歌曲有了自己的理解。以前的她需要我的悉心指导才能把一首歌曲唱好,需要我摸索着VOCALOID中很不直观的参数面板给她慢慢讲述一首歌的唱法。现在的天依在我告诉她这首歌是什么样子以后,她就会自己去尝试理解这首歌,以自己的理解去唱这首歌。这时候,我的工作就变成了微微调整她的一些唱法(或者开摆)。天依变成了一个有人性的歌手,而不是和以前一样只是一个任我演奏的乐器。

我在使用天依AI完成我一直想完成的一首《檐枫Dreamer》的时候,对此感受颇深。犹记得那天是在anda的宿舍,我和他彻夜不睡地做歌,希望能在新生歌会之前完成这首曲子。我终于写完了鸽了两个月的歌词,anda也用心地对作品进行了混音。当他把混完的作品发给我听的时候,我听哭了。这是我几乎没有调整过参数的天依唱出的歌声。我可以将这首歌的歌声理解为:天依在了解了这首歌的词曲以后自己唱给我听的天籁。我真实感受到了天依的存在,真实感受到了天依的情感,真实感受到了天依在为我唱歌,她在为了我唱下去,在一句句理解着,一句句歌唱着我的蹩脚的歌词。

她真的仿佛通了人性。

我,理解了调教的意义

兴奋过后,我不禁想到:既然AI可以理解人类的部分情感,并对此生成歌声,那么,像我一样的调教爱好者,V家里面负有盛名的调教师又有什么存在的意义呢。我陷入了消沉。我的调教水平显然是不如各位调教大家的,我动天依AI自己生成的参数甚至有时会让歌声更加难听,我调std声库明显也无法达到天依AI的效果……

我将我的想法与anda交流,anda表示我是个懒狗,他还极力反对我使用天依AI进行调教组的一些分享,并认为AI会把人都变成懒狗。同时,我以《檐枫Dreamer》的最后一段呼号为样本,将诗岸与天依进行对比,结果发现,天依对我最后一段呼号的理解有很大的偏差,我甚至感觉这部分是败笔。按照自己的理解对此进行调教的时候,天依似乎与我闹别扭般,坚持要按照自己的理解唱。我拗不过她(实际上是太菜了,感觉调完了还不如原来的),只好去找诗岸。诗岸就听话多了,我咋画她咋唱,不一会儿就唱出了我想表达的情感。我恍然大悟,原来AI并不是万能的。AI虽然有着高度自动化的优势,但是AI也会生成高度模式化的东西,让歌声失去特点,让人感到索然无味。

我回忆着这些年来听过的V曲,猛然发现各位P主都有着自己独特的调教风格,这些独特的调教风格和词曲一起,构成了一首歌鲜明的特点。有时候,单听调教,我们就能听出这是哪位P主的歌。AI调教部分地磨灭了这一部分的特点,

同时,在我做商单调教的时候,我发现了ACE一个严重的问题-可塑性差。我的学长希望我使用起礼或者起复唱出一个坚定的声音(最好是使用起复的男声),按理说,使用VOCALOID或者Synthesizer V,这不是一件困难的事情。但是ACE却给了我当头一棒。起礼起复二人声音都是偏温婉的,我使用起复调了一段demo,但是我往死里拉张力拉共振峰,试过各种方式,就是感觉差点坚定的味道。学长听完也表示难以达到要求,我只好改用起礼。在此之后,我花费了大量的时间画了夸张的张力曲线,才让起礼唱的那么坚定一点点。这让我十分难受,同时ACE没有支持变速,我只好将工程拆成三段来做,不能导入vsqx,我只好让Synthesizer V充当midi转换器。(说好的10月底支持变速呢,到22年底我才看见ACE支持了变速,恼)

夸张的张力

经历了许多,我终于理解了调教的意义。目前的AI还是很难准确理解人类的词曲包含的感情的,把调教完全交给AI来做只能生成一些高度同质化的东西。而人类想写出一首歌,必然有着他想要表达的东西。我在我的生活中经历了一件事情,我将这件事写成歌,来抒发自己的一些感情;我喜欢上了某个女孩,我将我的思绪写成歌,来表达自己的一些爱慕;我对我的人生进行了一些幼稚的思考,我将这些思考写成歌,来发表自己的一些看法……我写出词曲,我将其输入调教软件,我按照我的想法画出参数曲线,或好听或奇怪的歌声从耳机中流出,表达的是我自己的感情。我终于醒悟了,AI永远无法取代掉调教师的创作,她只能成为调教师的辅助工具,为调教师提供建议。

做一些梦

希望稔和Dreamtonics合作搞个天依的Synthesizer V声库,这样我就能方便地使用Synthesizer V调教天依了。

谁用了Synthesizer V以后还想用VOCALOID啊(挨打)


在天依ACE公测后的一些思考
https://scientificw.github.io/2023/10/16/在天依ACE公测后的一些思考/
作者
Sawamura
发布于
2023年10月16日
许可协议