5.
Human-level
control through deep reinforcement learning, by Volodymyr M., Koray K.,
David S., Andrei A. R., Joel V et al (2015) (Cited: 2,086)
链接:https://web.stanford.edu/class/psych209/Readings/MnihEtAlHassibis15NatureControlDeepRL.pdf
这里我们使用最近在训练深度神经网络方面的进展来开发一种称为深度Q网络的新型人工代理。它可以使用端到端强化学习直接从高维感官输入中学习成功策略。我们在经典Atari 2600游戏挑战中测试了该代理。
6.
Faster
R-CNN: Towards Real-Time Object Detection with Region Proposal
Networks, by Shaoqing R., Kaiming H., Ross B. G. & Jian S. (2015)
(Cited: 1,421)
链接:https://arxiv.org/pdf/1506.01497.pdf
在这项工作中,我们引入了一个区域提议网络(RPN),该网络与检测网络共享全图像卷积特征,从而实现了几乎免费的区域提案。 RPN是一个完全卷积网络,可同时预测每个位置的对象边界和对象评分。
7.
Long-term
recurrent convolutional networks for visual recognition and
description, by Jeff D., Lisa Anne H., Sergio G., Marcus R., Subhashini
V. et al. (2015) (Cited: 1,285)
链接:https://arxiv.org/pdf/1411.4389.pdf
当前模型假设了固定时空感受域或简单的时间平均,并将其用于顺序处理,反复卷积模型具有“双重深度”,因为它们可以在空间和时间“层”中组合。
8.
MatConvNet: Convolutional Neural Networks for MATLAB, by Andrea Vedaldi & Karel Lenc (2015) (Cited: 1,148)
链接:https://arxiv.org/pdf/1412.4564.pdf
它将CNN的模块实现为易于使用的MATLAB函数,并提供了带滤波器组、特征池等等的程序用于计算线性卷积。文档概述了CNN及其在MatConvNet中的实现方式,同时给出了工具箱中每个运算块的技术细节。
9.
Unsupervised
Representation Learning with Deep Convolutional Generative Adversarial
Networks, by Alec R., Luke M. & Soumith C. (2015) (Cited: 1,054)
链接:https://arxiv.org/pdf/1511.06434.pdf
本文希望缩小无监督学习与有监督学习的CNN成功之间的差距。我们引入了被称作深卷积生成对抗网络的一类CNN,其拥有一定的架构约束,并证明他们是无监督学习的有力候选。
10.
U-Net: Convolutional Networks for Biomedical Image Segmentation, by Olaf R., Philipp F. &Thomas B. (2015) (Cited: 975)
链接:https://arxiv.org/pdf/1505.04597.pdf
深度网络的训练效果需要数以千计的注释训练样本作为支撑已是共识。本文提出了一个依赖于数据增强的网络和训练策略以便更有效地使用可用的注释样本。
11.
Conditional
Random Fields as Recurrent Neural Networks, by Shuai Z., Sadeep J.,
Bernardino R., Vibhav V. et al (2015) (Cited: 760)
链接:http://www.robots.ox.ac.uk/~szheng/papers/CRFasRNN.pdf
本文引入了一种同时包含卷积神经网络(Convolutional Neural Networks)与基于条件随机场
(Conditional Random Fields)
的概率图像模型的新型卷积神经网络。为此,我们将带有高斯对势的条件随机场的平均场近似推断作为循环神经网络。
12.
Image Super-Resolution Using Deep Convolutional Networks, by Chao D., Chen C., Kaiming H. & Xiaoou T. (2014) (Cited: 591)
链接:https://arxiv.org/pdf/1501.00092.pdf
本文使用直接学习高/低分辨率图像之间的端到端映射。该映射使用卷积神经网络,将低分辨率图像作为输入并输出高分辨率图像。
13.
Beyond
short snippets: Deep networks for video classification, by Joe Y. Ng,
Matthew J. H., Sudheendra V., Oriol V., Rajat M. & George T. (2015)
(Cited: 533)
链接:https://arxiv.org/pdf/1503.08909.pdf
本文建立并评估了几种深度神经网络架构,以整合比以前尝试的更长时间的视频图像信息。
14.
Inception-v4,
Inception-ResNet and the Impact of Residual Connections on Learning, by
Christian S., Sergey I., Vincent V. & Alexander A A. (2017) (Cited:
520)
链接:https://arxiv.org/pdf/1602.07261.pdf
深度卷积神经网络在近年来图像识别性能提升方面起到了核心作用。通过三个残差和一个inception-v4的集合,我们在ImageNet 分类挑战赛中获得了测试集上Top-5 错误率3.08%的成绩。
15.
Salient
Object Detection: A Discriminative Regional Feature Integration
Approach, by Huaizu J., Jingdong W., Zejian Y., Yang W., Nanning Z.
& Shipeng Li. (2013) (Cited: 518)
链接:https://arxiv.org/pdf/1410.5926.pdf
本文将显着图计算看作是一个回归问题。我们的方法基于多层级图像分割,最优化监督学习方法,以将地区特征向量映射为显着性分数。
16.
Visual
Madlibs: Fill in the Blank Description Generation and Question
Answering, by Licheng Y., Eunbyung P., Alexander C. B. & Tamara L.
B. (2015) (Cited: 510)
链接:https://www.cvfoundation.org/openaccess/content_iccv_2015/papers/Yu_Visual_Madlibs_Fill_ICCV_2015_paper.pdf
本文引入了一个新的数据集,包含有360,001个关于10,738个图像的自然语言描述,即Visual Madlibs 数据集。该数据集使用已自动生成的空白填充模板收集一些目标描述,包括:人和对象,外观,活动和交互,也包括整个场景或具有更广泛背景的内容。
17.
Asynchronous
methods for deep reinforcement learning, by Volodymyr M., Adrià P. B.,
Mehdi M., Alex G., Tim H. et al. (2016) (Cited: 472)
链接:http://proceedings.mlr.press/v48/mniha16.pdf
性能最佳的方法、 actor-critic的异步变体、超越了Atari领域的当前最佳表现,在单个多核CPU而非GPU上只需要一半的训练时间。
此外,我们展示了actor-critic的异步变体可以成功处理各种连续的电机控制问题,以及使用视觉输入以在随机的3D迷宫中导航的新任务。
18.
Theano:
A Python framework for fast computation of mathematical expressions.,
by by Rami A., Guillaume A., Amjad A., Christof A. et al (2016) (Cited:
451)
链接:https://arxiv.org/pdf/1605.02688.pdf
Theano是一个Python库,允许高效地定义、优化和评估涉及多维数组的数学表达式。 自推出以来,它一直是机器学习领域使用最多的CPU和GPU数学编译器之一,并且性能稳步提高。
19.
Deep Learning Face Attributes in the Wild, by Ziwei L., Ping L., Xiaogang W. & Xiaoou T. (2015) (Cited: 401)
链接:https://www.cvfoundation.org/openaccess/content_iccv_2015/papers/Liu_Deep_Learning_Face_ICCV_2015_paper.pdf
这个框架不仅比现有技术表现好得多,而且还揭示了有关学习脸部表征的有价值的事实:
20.
Character-level convolutional networks for text classification, by Xiang Z., Junbo Jake Z. & Yann L. (2015) (Cited: 401)
链接:
http://papers.nips.cc/paper/5782-character-level-convolutional-networks-for-text-classification.pdf
本文提供了一个关于使用字符级卷积网络
(ConvNets)
进行文本分类的经验性探索。 我们构建了几个大规模数据集,以表明字符级卷积网络可以实现最先进或最具竞争力的结果。
若您关注技术内容和清华相关信息,欢迎扫描文末二维码名片关注
“数据派THU”
李海明
中国科学院大学在读研究生,铁人三项业余运动员,热爱音乐、艺术、生活。喜欢结交各路神仙~一起坐驰神游,一起南辕北辙。
工作内容:
将选取好的外文前沿文章准确地翻译成流畅的中文。如果你是数据科学/统计学/计算机专业的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友,数据派翻译组欢迎你们加入!
你能得到:
提高对于数据科学前沿的认知,提高对外文新闻来源渠道的认知,海外的朋友可以和国内技术应用发展保持联系,数据派团队产学研的背景为志愿者带来好的发展机遇。
其他福利:
和来自于名企的数据科学工作者,北大清华以及海外等名校学生共同合作、交流。
点击文末
“阅读原文”