ECCV 2018 776篇论文一键下载

深度学习与神经网络 · 公众号 · · 2018-09-09 00:04

正文

点击上方“ 深度学习与神经网络 ”，选择“置顶公众号”

重磅干货，第一时间送达

ECCV 2018 将于2018年9月8日~14日在德国慕尼黑城市举行。本文将介绍第一手消息：ECCV 2018 所有的收录论文名单（含论文标题及PDF下载链接）。

前言

前天的文章 ECCV 2018 收录论文名单全公布只介绍了很cool的网址，包含了ECCV 2018 所有论文的标题和PDF下载链接。但一篇篇看标题，一篇篇下载，实在很难受。

link: http://openaccess.thecvf.com/ECCV2018.py

ECCV 2018 776篇论文一键下载

感谢很多私信我的朋友，你们真是Python大佬，爬虫小王子/小公主。让我顺利下载好ECCV 2018所有论文。

为了省时间（其实是网速慢），我已经在百度网盘上备好份了。感谢知乎ID：杨之水的分享，我其实用的就是ta分享的百度云链接。

如何一键下载ECCV 2018共计776篇论文呢？

关注深度学习与神经网络，后台回复： ECCV2018

即可获得百度网盘链接，一键保存=下载

注：776篇论文，这个数字可能存在问题，因为我自己下载的论文数量是774篇，但有小伙伴说是776篇，我并没有深入验证，因为差距并不大。所以暂且以776篇为准，如有错误，还请大家指正。

Python爬虫代码

授之以鱼，不如授之以渔。

贴心的Amusi已经为大家准备好了爬虫代码（建议Ubuntu下使用）

 1# coding=utf-8
 2from multiprocessing import Pool
 3import requests
 4from bs4 import BeautifulSoup
 5import traceback
 6import re
 7import os
 8
 9prefix = 'http://openaccess.thecvf.com/'
10save_dir = 'ECCV2018'
11
12def get_pdf(data):
13    href, title = data
14    name = re.sub(r'[\\/:*?"<>|]', ' ', title) 
15    if os.path.isfile("ECCV2018/%s" % name):
16        print("File already exsists, skip %s" % name)
17        return
18    try:
19        content = requests.get(prefix+href).content
20        with open(save_dir+"/%s.pdf" % name, 'wb') as f:  # You may change to "path/to/your/folder"
21            f.write(content)
22        print("Finish downloading %s" % title)
23    except:
24        print('Error when downloading %s' % href)
25        print(traceback.format_exc())
26
27pool = Pool(10)
28if not os.path.exists(save_dir):
29    os.mkdir(save_dir)
30