[1711.03637] Learning and Real-time Classification of Hand-written Digits With Spiking Neural Networks
简评:作者提在通用GPU平台实现了一种新颖的SNN(spiking neural network)网络去实时地完成手写数字图片的分类任务。在MNIST数据集上达到了99.8%的训练集准确率和98.6%的测试集准确率,然而参数量只为性能最好的spking网络的七分之一。
[1711.05491] Squeeze-SegNet: A new fast Deep Convolutional Neural Network for Semantic Segmentation
简评:作者提出Squeeze-SegNet,这是一种可部署在嵌入式平台如自动驾驶场景下、用于语义分割的全卷积网络,其结构与编解码器非常类似,集合了squeeze-decoder模块、上采样以及反卷积层等等。在Camvid和City-states等数据集上达到了和SegNet一样的准确率,但参数量仅为SegNet的十分之一。
[1708.05237] S^3FD: Single Shot Scale-invariant Face Detector [code]
简评:作者提出一种名为S^3FD(Single Shot Scale-invariant Face Detector)的实时人脸检测器,这是一个能胜任各种尺度输入的单神经网络模型,尤其是小人脸。而作者工作的重点就是要解决基于anchor的检测器在物体变小时,性能会下降的问题。作者主要做了以下三点:1.提出随尺度变化的人脸检测框架来解决人脸尺度的问题;2.通过尺度补充的anchor策略来提升对小人脸的召回;3.通过max-out背景标注来减少小人脸的false positive rate。在AFW、PASCAL face、FDDB和WIDER FACE这几个数据集上都达到了state-of-the-art的检测性能,在NVIDIA Titan X(Pascal)显卡上达到了36fps的帧率。
[1711.05860] A General Neural Network Hardware Architecture on FPGA
简评:现场可编程门阵列(FPGA)由于高度并行体系结构,低功耗,自定义算法的灵活性。在神经网络和机器学习算法的高能效实现上有巨大优势。作者基于XILINX ZU9CG系统芯片(SOC)平台,实现了一个支持训练和推断的通用神经网络硬件架构。
[1711.05979] Performance Modeling and Evaluation of Distributed Deep Learning Frameworks on GPUs 译文
简评:这篇论文评估了四个state-of-the-art的分布式深度学习框架,即Caffe-MPI, CNTK, MXNet 和 TensorFlow分别在单个GPU、多GPU和多节点的环境中的表现。
[1711.07607] Knowledge Concentration: Learning 100K Object Classifiers in a Single CNN
简评:超细粒度图像分类是图像搜索和移动AI助手所需要的。然而训练一个具有10万类的大型模型的训练速度和分类性能是一个挑战。一个解决方案是训练独立的专家网络,每个专家集中学习一个特定垂直领域(如汽车、鸟类等)。然而,在实际的系统中部署数大量专家网络会增大系统复杂性和推理延迟,并消耗大量的计算资源。作者提出一个知识浓度方法,将知识从数十名专家网络蒸馏成一个单一模型(一个学生网络)对100k类别分类。作者主要工作有三点:1.提出multi-teacher蒸馏的框架;2.自主学习机制,允许学生从不同的老师处学习;3.用结构连接层扩大学生网络容量。在OpenImage数据集上达到比baseline更大的性能提升。
JianyangZhang/Self-Driving-Car-AI: A simple self-driving car AI python script using the deep Q-learning algorithm
简评:Deep Q-learning无人车AI项目。
BlinkDL/BlinkDL: A minimalist deep learning library in Javascript using WebGL + asm.js. It can do convolutional neural network in your browser.
简评:一个极简Javascript中使用WebGL + asm.js深度学习库,它可以在浏览器中执行卷积神经网络。
masahi/nnvm-vision-demo: Demos interesting image-in, image-out networks running on both NVIDIA and AMD GPUs, with NNVM
简评:用GAN实现图像生成,底层支持NVIDIA和AMD的GPU。
explosion/lightnet:
🌓
Bringing pjreddie's DarkNet out of the shadows #yolo
简评:LightNet提供DarkNet简单高效的Python接口,DarkNet框架由YOLO和YOLOv2的作者实现。LightNet在的主要目的是做图像的目标检测和分割。
LamHoCN/Depth_conv-for-mobileNet: Depth_conv for MobileNet
简评:用CUDA实现的MobileNet的depth_conv。
hahnyuan/video_labeler: A GUI tool for conveniently label the objects in video, using the powerful object tracking.
简评:视频标记工具,带有给力的跟踪辅助功能。
jcupitt/libvips: A fast image processing library with low memory needs.
简评:超快的图像处理框架。
AITTSMD/MTCNN-Tensorflow: Reproduce MTCNN using Tensorflow
简评:使用Tensorflow实现MTCNN。
Carla – An open-source simulator for autonomous driving research | Hacker News
简评:自驾模拟开发环境资源汇总。