专栏名称: PerfXLab卧谈会
PerfXLab澎峰科技。本公众号分享人工智能,HPC,性能优化等领域的技术文章以及八卦等。
目录
相关文章推荐
51好读  ›  专栏  ›  PerfXLab卧谈会

嵌入式AI 双周简报 第18期

PerfXLab卧谈会  · 公众号  · AI  · 2018-04-30 23:30

正文

请到「今天看啥」查看全文


点击文末 阅读原文 跳转到我们的双周简报主页,可以阅读带条目超链接的版本。

业界新闻

论文

  • [1804.07573]MobileFaceNets: Efficient CNNs for Accurate Real-time Face Verification on Mobile Devices
    简评:本文展示了一种非常高效的CNN模型,叫做MobileFaceNets,它使用不超过100万个参数,专门为在移动设备和嵌入式设备上的高精度实时人脸验证而量身定做。还对常见移动网络的弱点进行了简单的分析。作者特别设计的MobileFaceNets已经克服了这个弱点。在相同的实验条件下,MobileFaceNets的准确性更高,而且比MobileNetV2的实际加速要高出2倍。在经过了改进后,我们的单移动facenet模型的0。4 MB的大小,达到了99。55%的人脸验证精度,在MegaFace挑战1上达到了92.59%(FAR1e-6),这甚至可以与最先进的CNN模型的数百MB大小相媲美。我们的MobileFaceNets中最快的一个在移动电话上有18毫秒的实际推理时间。

  • [1711.05408] RNN作为识别器,判定加权语言一致性
    简评:该论文探索了识别加权语言的RNN形式模型的计算复杂度。研究表明,大多数类似的RNN中存在的问题都是不可判定的,包括:一致性、等价性、最小化和最高权重字符串的确定。然而,对于连续一致的RNN来说,最后一个问题是可判定的。

  • [1804.09882] A Neural Embeddings Approach for Detecting Mobile Counterfeit Apps
    简评:本文提出了利用先进的神经嵌入生成卷积神经网络(cnn)来衡量图像之间的相似性。结果表明,在伪检测问题上,采用了一种新颖的方法,采用了由CNN过滤网的克氏矩阵给出的样式嵌入方法,比内容嵌入和筛选功能等基线方法更有效。我们发现,通过将样式嵌入与内容嵌入相结合,可以实现进一步的性能提升。

  • [1804.07090]Low Rank Structure of Learned Representations
    简评:本文通过对图像分类的模型进行了研究,并对其进行了研究,并对其进行了研究。我们关注的是ResNet-18、ResNet-50和VGG-19,并观察到当在CIFAR10或CIFAR100数据集上进行训练时,学习的表示表现出相当低的等级结构。我们建议对训练程序进行修改,进一步鼓励在神经网络的不同阶段对激活的低等级表示。从经验上来说,我们证明这对对抗的例子有一定的压缩和健壮性。

  • [1804.09060] An Information-Theoretic View for Deep Learning
    简评:深度学习的信息论观点——卷积层和池化层是收缩函数,会导致信息损失;由于深度网络增加这些层,输入和输出间的互信息指数级减小,泛化误差也会指数级减小。

  • [1804.05806]Deep Embedding Kernel
    简评:在本文中,我们提出了一种新的监督学习方法,称为深埋核(DEK)。德克将深度学习和内核方法的优势结合在一个统一的框架中。更具体地说,德克是一个可学习的内核,它由一个新设计的深层架构所代表。与预先定义的内核相比,这个内核可以被显式地训练成将数据映射到一个优化的高级特性空间,其中数据可能对应用程序有良好的特性。

  • [1804.06913] Fast inference of deep neural networks in FPGAs for particle physics
    简评:本文通过对图像分类的模型进行了研究。关注的是ResNet-18、ResNet-50和VGG-19,并观察到当在CIFAR10或CIFAR100数据集上进行训练时,学习的表示表现出相当低的等级结构。我们建议对训练程序进行修改,进一步鼓励在神经网络的不同阶段对激活的低等级表示。从经验上来说,作者证明这对对抗的例子有一定的压缩和健壮性。


开源项目

  • 谷歌MobileNetV2:推动下一代移动计算机视觉网络 | 机器之心
    简评:谷歌发布MobileNet重大更新,推出MobileNetV2,在结构上使用depthwise可分离卷积为基础,在层与层之间增加了线性的bottleneck,并且bottleneck之间也增加了残差连接,因此速度更快,精度更高,更适合设备上处理。

  • Swift for TensorFlow开源
    简评:Swift for TensorFlow 为 TensorFlow 提供了一种新的编程模型,将 TensorFlow 计算图与 Eager Execution 的灵活性和表达能力结合在了一起,同时还注重提高整个软件架构每一层的可用性。为了实现我们的目标,经过深思熟虑,我们决定直接改进 Swift 编程语言和编译器,使得 Tensor 成为 Swift 语言里面的一等公民,以此提升用户体验。

  • PyTorch 0.4:完全改变API,官方支持Windows
    简评:PyTorch官方在GitHub发布0.4.0版本,最重要的改进是支持Windows系统。新版本完全改变了API,是本年度最重大的升级。

  • Pelee:手机上的实时目标检测
    简评:移动设备上的实时监测系统。

  • 基于MXNet的深度学习自然语言处理包GluonNLP
    简评:它支持简单的文本预处理、数据集加载和神经模型构建,以帮助您加速自然语言处理(NLP)研究。


博文

  • 如何评价商汤科技开源的深度学习框架Parrots | 知乎
    简评:商汤这次开源的Parrots和TensorFlow、PyTorch、MxNet等主流开源框架相比有何优点与缺点?

  • 一流科技创始人袁进辉:深度学习引擎的最优架构 | 机器之心
    简评:OneFlow 的袁进辉老师分析已有框架的优缺点,分享深度学习框架应该怎么做的观点。

  • 边缘计算探索:处理器,算法与内存
    简评:边缘计算是人工智能和物联网结合的产物,是未来的重要趋势。未来边缘计算的关键技术,包括新处理器(强通用处理器或专用加速器),内存内计算,网络模型压缩,以及新存储器。

  • ResNet及其多种变体 | TowardsDataScience
    简评:本文主要介绍了 ResNet 架构,简要阐述了其近期成功的原因,并介绍了一些有趣的 ResNet 变体。

  • 用AI让静图变动图:CVPR热文提出动态纹理合成新方法
    简评:来自加拿大约克大学、Ryerson 大学的研究者们提出了使用「双流卷积神经网络」的动画生成方法,其参考了人类感知动态纹理画面的双路径模式。该动画生成模型可以参考相关视频,让一张静态图片变成效果逼真的动画。目前,该研究的论文已被 CVPR 2018 大会接收,相关代码也已公开。

  • 当前深度神经网络模型压缩和加速都有哪些方法?| PaperWeekly
    简评:本文全面概述了深度神经网络的压缩方法,主要可分为参数修剪与共享、低秩分解、迁移/压缩卷积滤波器和知识精炼,论文对每一类方法的性能、相关应用、优势和缺陷等方面进行了独到分析。


Editor: 王建章、袁帅


点击文末 阅读原文 跳转到我们的双周简报主页,可以阅读带条目超链接的版本。

PerfXLab澎峰科技

请躺下







请到「今天看啥」查看全文