各种智能输入法已经帮助我们提高了键盘打字的效率,但潜在的影响是我们的键入记录很多会上传到服务器。
智能输入法需要依靠收集用户的键入记录来提高各种字词短语的预测,收集的信息越多则预测的结果越准确。
但对于用户来说这可能是个比较糟糕的问题,如此前几款输入法软件都被发现明文传输用户键入的所有内容(有关该内容请查看本次推送的第四篇文章)。
且不说这些输入法开发商利用这些数据都干什么,仅明文传输就非常容易让攻击者发起中间人攻击窃取内容。
苹果和谷歌都有自己的输入法也同样面临这个问题,在国外要是这么明目张胆的收集数据可能会被罚到破产。
日前谷歌旗下的输入法里使用新的联合学习技术来达到收集输入数据的目的,数据收集成功且不含隐私信息。
谷歌的做法是新开发了个名为文本预测模型的东西加载到设备里,然后从键盘键入行为数据里进行自动学习。
收集的信息经过处理后会保存在设备本地存储,然后仅仅将信息的摘要内容发送云端再与其他数据进行整合。
到这里再创建新的共享预测模型,输入法再通过云端加载这个共享预测模型来达到提高输入法预测的准确率。
新的技术手段除了可以提高输入法预测的准确率之外,同时也避免了将含有用户私密信息的内容上传服务器。
同时也可以降低用户上传内容所消耗的流量和占用的带宽,对谷歌来说也可以节省输入法服务器的资源开支。