[1712.07316]
A Flexible Approach to Automated RNN Architecture Generation
简评:该论文提出了一个领域特定的语言(DSL)用于自动化架构搜索,可以产生任意深度和宽度的新型RNN。DSL足够灵活以定义标准体系结构,如门控重复单元和长期短期内存,并允许引入非标准RNN组件,如三角曲线和层规范化。使用两种不同的候选生成技术,具有排序功能的随机搜索和强化学习,我们探索由RNN DSL为语言建模和机器翻译领域所创建的新架构。由此产生的体系结构并不遵循人类的直觉,而是在其目标任务上表现良好,这表明可用的RNN体系结构的空间远大于以前的假设。
[1712.07798]
Deep learning for predicting refractive error from retinal fundus images
简评:屈光不正是导致视力损害的主要原因之一,可以通过简单的干预措施(如处方眼镜)来纠正,作者使用深度学习算法来检验实验者的眼底照片,计算结果表表明深度学习可以用来从医学图像中进行新的预测。
[1712.06076]
Using Deep learning methods for generation of a personalized list of shuffled songs
简评:文章中作者建议通过构建一个卷积深层信念网络,从而解决音乐播放系统中随机播放的歌曲不符合用户心情的问题,所学习的参数将用于初始化多层感知器,该多层感知器将用户的播放列表的提取特征作为输入与元数据一起输入以分类到各种类别。
[1712.04910]
FFT-Based Deep Learning Deployment in Embedded Systems
简评:嵌入式平台由于其可移植性,多功能性和能源效率,正在成为深度学习部署的关键,但是DNN加重了嵌入式平台的计算和存储,作者提出了一种适用于嵌入式平台的基于快速傅立叶变换(FFT)的DNN训练和推理模型,其计算和存储的渐近复杂度降低。
[1712.05083]
Extreme 3D Face Reconstruction: Looking Past Occlusions
简评:在提供在极端条件下,从平面旋转和遮挡中观察到的人脸的详细三维重建。作者根据凹凸贴图的概念,提出了一种分层的方法,该方法将全局形状的估计与它的中等细节(例如,皱纹)解耦。我们估计一个粗糙的三维表面形状,作为基础,显示在现有技术状态经常破裂的观察条件下产生详细的3D面部形状。
[1611.08050]
Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields
简评:作者提出用一种方法来高效的检测图像中多个人的二维姿态,该方法使用非参数表示来学习将身体部位与图像中的个体相关联,无论图像中的人有多少,都能保持高精度和良好的实时性。