专栏名称: 微软亚洲研究院
专注科研18年,盛产黑科技
目录
相关文章推荐
爱可可-爱生活  ·  【[261星] ... ·  21 小时前  
爱可可-爱生活  ·  【NBP:通过半自回归建模实现视频生成的创新 ... ·  昨天  
爱可可-爱生活  ·  【[15.3k星]PandasAI:用自然语 ... ·  昨天  
命里有票  ·  用DeepSeek和豆包分别计算了一个日期问 ... ·  2 天前  
命里有票  ·  用DeepSeek和豆包分别计算了一个日期问 ... ·  2 天前  
51好读  ›  专栏  ›  微软亚洲研究院

隔空互动,你不用再去办公室了!微软Build 2019黑科技秒杀同传+速记

微软亚洲研究院  · 公众号  · AI  · 2019-05-07 19:17

正文



编者按: 在一年一度的微软全球开发者大会Build 2019上,微软首席执行官萨提亚·纳德拉发表了主题演讲并发布了一系列重磅产品,其中极具未来感的办公产品格外吸引眼球。现在让我们来看看微软今年又带来了哪些惊喜吧!本文经授权转载自微信公众号“新智元”。


未来感爆棚!


又一年微软全球开发者大会如期而至,同样的萨提亚·纳德拉,带来了一个 极具未来感 的微软。



萨提亚·纳德拉在本次大会上发布了Azure和开发者相关众多产品,堪称“全家福”亮相:


  • 未来会议室公布“丹麦项目”;

  • 微软Teams增设AR隔空办公;

  • AI辅助编码IntelliCode发布预览版;

  • 上线基于Chromium重新打造的Edge浏览器;

  • Cortana(小娜)的会话功能得到很大改进;

  • 收购首个使用微软AI的自主系统Bonsai

  • 开放量子编程语言Q#和量子编译器源代码


其中,最引人注目的当属微软在办公领域的一些列突破,可以说是极具未来感与科幻感,引得网友一片惊呼。当然,开发者相关的众多发布也是非常吸睛的!



“未来会议室”再升级,
秒杀同传+速记


在去年Build大会上,微软推出的未来会议室使用的是360度相机和麦克风阵列,可以检测会议室中的任何人说话。摄像头能够把各个画面拼成一个全景画面,还可以进行人脸识别,以确保参会者的身份。此外,还能把会议室预约系统做进去。


微软全球开发者大会 Build 2018 展示未来会议室


更强大的是,这个未来会议室还有基于语义分析的会议纪要功能,能够实时同传+速记。这着实亮瞎了一票观众,纷纷表示 同传、速记要失业了


细心的读者可以发现,未来会议室中间会有一个黑色的柱状物体,这便是麦克风阵列中的“重要设备”。


而在今年的 Build 大会上未来实验室再升级,公布了 “丹麦项目” ——简单来说就是让你身边配有的普通麦克风“秒变”虚拟麦克风阵列:


“重要”设备,拿掉!



虚拟麦克风阵列将现有设备 (如手机或笔记本电脑) 与普通麦克风如搭乐高积木一般动态地组合成一个更大的阵列。丹麦项目可以帮助客户在有或没有专门的麦克风阵列 DDK 的情况下都可以更容易地转写对话,随时随地使用 Azure 语音服务。



丹麦项目未来的应用场景非常广泛。例如,可以对多个 Microsoft Translator 应用程序进行配对,更有效地帮助多人使用移动电话进行沟通,从而将语言障碍降到最低。


网友们不禁惊呼:“真的是越来越智能了!”


但推动微软AI演进历程,与其近三年来在语音和语言研究中的突破密不可分。微软在以下几个广泛使用的公共基准测试任务中,率先实现了 AI 超越人类水平的历史性里程碑:





这些突破对从翻译应用到智能音箱等众多口语应用产生了深远的影响。虽然现在市面上已经有智能音箱,但大多数智能音箱 一次只能处理一个人的语音指令 ,并且在发出指令之前, 需要一个唤醒词。


微软已将一些重要的技术突破加入到 Azure 语音服务中,并提供新的对话转写功能,该功能已经在今天的预览版中提供。该功能通过微软的 Devices SDK (DDK),纯音频或视听麦克风阵列设备得到了增强。这是人工智能进化历程中的重要一步,因为 环境远场多人语音转写几十年来都没有得到突破性的进展。


新的会话转写 (Conversation Transcription) 功能扩展了微软现有的 Azure 语音服务,支持实时的远场多人语音转写和说话人归因。与 Speech DDK 相结合,房间里有一群人在谈话时,会话转写也可以有效地识别每个人的语音,处理诸如交叉对话等常见但具有挑战性的场景,并生成转写。


会话转写功能利用多通道数据,包括来自代号为 Princeton Tower 的 Speech DDK 的音频和视觉信号。边缘设备是基于参考设计的 360 度音频麦克风阵列或 360 度鱼眼摄像头,通过视听融合来支持更好的转写。边缘设备将信号发送到 Azure Cloud 进行神经信号处理和语音识别。


隔空办公,身临其境

很多时候办公会因为地域的差距不得不选择出差,但是微软在此次发布会中展示了未来办公的方式—— 无需出差便可身临其境!


只需双方都打开微软的Teams软件,建立一个AR“房间”,戴上AR眼镜,便可以开始隔空办公了!



更神奇的是,隔空双方还可以通过AR进行互动。



当然,虚拟交互、创作也是不在话下的。



这看起来仿佛只有在科幻大片中才能见到的工作方式,已然开始进入我们的生活了!


因为与面对面的人交谈总是比视频聊天或通过电话更好,这样的技术会使项目上的合作变得更加容易。


AI辅助编码——IntelliCode发布预览版



发布会上还晒出来AI辅助编码工具,现在已经普遍可用!


它支持Visual Studio中的C#和XAML以及Visual Studio Code中的Java,JavaScript,TypeScript和Python。 默认情况下,它现在也包含在Visual Studio 2019中。


IntelliCode本质上是下一代IntelliSense(微软极受欢迎的代码完成工具)。那么又是什么原因使得 IntelliCode与众不同呢?


答案是微软通过向GitHub提供数千个至少有100颗星的开源项目的代码来训练它。 使用此数据,该工具可以制作更智能的代码完成建议。 它还会在提出建议时考虑当前的代码和上下文。



默认情况下,IntelliSense会为开发人员提供按字母顺序排列的列表。虽然这很有用,但是用户需要的代码往往是列表中的一些项目。


像IntelliCode这样的工具的承诺是让开发人员的生活更容易,提高生产力,减少bug的可能性。随着这些工具变得越来越智能,它们很可能能够更深入地进行预测,甚至可能建议根据用户要实现的内容以及其他人如何解决类似问题的知识自动完成程序代码的大部分。


基于Chromium重新打造的
Edge
浏览器上线,内置IE模式

2015年发布的Edge浏览器,一直没有取得太大进展。


事情到了不得不改变的时候。2018年末,微软做出了一个巨大的决定: 抛弃微软自己开发的浏览器内核,采用Chromium内核重新开发。


基于 Chromium 内核的新 Edge 浏览器


上个月,微软终于正式公开了基于 Chromium 的 Edge 浏览器,向 Windows 10 用户开放了首批测试版本。


在今天的大会上,Edge 浏览器迎来三个 新的变动 ,一是 IE 模式,二是隐私控制,三是收集功能。


IE模式


新标签页打开IE模式


新版本Edge浏览器将内置IE模式,只需在Edge内打开一个新标签页就可以直接访问IE模式。也就是说,你可以在Edge浏览器中运行基于Internet Explorer的旧版web应用程序,而无需切换到其他浏览器。


收集功能


Edge还增加了新的收集功能(Collections),微软表示,收集功能可以帮助用户更有效地收集和组织内容,而且该功能还与Office集成。 打开Edge浏览器右侧的面板,可以显示所有收集,也可以通过将想要的内容拖放到面板中直接收集。


隐私控制


Edge浏览器将支持全新的隐私控制,你可以在无限制、平衡和严格三种模式中选择。根据你选择的隐私控制模式,Edge 会自动调整设置,限制第三方和网站通过互联网跟踪你的行为。


尽管微软表示这些新功能将在下一版本的Edge浏览器中推出,不过还没有说明具体日期。目前可以在官网下载开发版本尝鲜。




小娜没黄:技能型的语音助理,
不止是对话



2018年,谷歌大秀了一把Google Assistant的“Duplex双工技术”,一通如同真人一般的订座电话让人惊呼“给你打电话的可能不是人”。相比之下,微软的数字助理Cortana(小娜)似乎没有太多声音。


不过,微软一直在慢慢地将Cortana重新定位为一种“技能型语音助理”,而不是Google Assistant、亚马逊Alexa或苹果Siri的竞争对手。


在今天的大会上,微软展示了Cortana如何 响应对话、主动组织会议和提醒 。接近3分钟的demo中,Cortana与用户无障碍对话,像一个真正的工作场所的“助理”,同样令人印象深刻。



Cortana的会话功能得到了很大的改进。微软去年收购了Semantic Machines公司,他们与微软的研究人员合作,正在构建一种会话AI,将技能和上下文语义结合起来,让Cortana这样的数字助理真正能做你让它们做的事情。








请到「今天看啥」查看全文