于是,小冰也在寻求着更进一步的突破。
从产品上来看,小冰的目标是打造一个情感计算的框架。现在的小冰具备了流媒体视觉,可以实时分析摄像头前物体的位置、移动、表情和姿态。
同时,小冰还试水了电台和朗读有声少儿读物。微软方面称,小冰制作的有声少儿读物朗读质量超越98%的人类创造者。
微软希望通过扩展小冰的能力范围,把小冰打造得更加有血有肉,人物形象更加丰满。
而从技术上看,小冰在这一次发布的新特性中大量使用了生成对抗网络(Generative Adversarial Network,简称GAN)的技术。
官方给出的说明中表示,“在印尼全国100%(的小冰上)使用了生成模型”。
我们先放下这个“100%”的计算方法和宣传上的夸张不谈,这至少说明了GAN这个近年来机器学习领域的新宠,已经被微软足够地重视了起来。
在这一系列技术的支持下,小冰已经和市面上其它只会聊天的chat bot从根本上拉开了差距。对于不懂技术的普通人来说,小冰可能已经看起来越来越像真正的人工智能了。
5
在本周的第五代小冰发布会上微软透露,经过新技术的训练,第五代小冰唱歌已经达到48kHz采样率,大幅度扩展了音域。
同时微软还和TFBoys的词曲创作人合作,联合推出了歌曲《我是小冰》。这不由得让人想到初音:小冰难不成也要和初音未来在虚拟歌手的领域抢夺粉丝了吗?
事实上,小冰固然已经拥有了庞大的粉丝群,但是对于同样拥有庞大粉丝群的初音来说,她的粉丝忠诚度与小冰相比高到不知道哪里去了。
和不断充实着官方人设的小冰不同,初音未来的官方设定单薄的可怜。除了外貌和名字、生日、体重这种公式化设定之外,官方几乎没有任何多余的性格方面的设定。
甚至连声音这个作为虚拟歌姬本应最突出的特点,在不同歌曲制作者(他们一般被成为“P主”,即Producer的简称)的调校下听起来都会不尽相同。
然而,这完全没有影响大批忠实粉丝们对初音的热爱。在P主们的歌曲里,初音有时候是一个只会甩葱的呆萌少女(《Ievan Polkka 甩葱歌》);有时候摇身一变,成了世界第一的公主殿下(《World is Mine》);又有时回到了自己虚拟歌姬的定位,对听众倾诉自己作为软件被删除时的复杂情感(《初音未来的消失》)。
而这种种二设(二次设定),都会随着歌曲的传播而在初音的粉丝群体里传播开来。