点击上方“
深度学习与神经网络
”,选择“置顶公众号”
重磅干货,第一时间送达
ECCV 2018 将于2018年9月8日~14日在德国慕尼黑城市举行。本文将介绍第一手消息:ECCV 2018 所有的收录论文名单(含论文标题及PDF下载链接)。
前言
前天的文章
ECCV 2018 收录论文名单全公布
只介绍了很cool的网址,包含了ECCV 2018 所有论文的标题和PDF下载链接。但一篇篇看标题,一篇篇下载,实在很难受。
link: http://openaccess.thecvf.com/ECCV2018.py
ECCV 2018 776篇论文一键下载
感谢很多私信我的朋友,你们真是Python大佬,爬虫小王子/小公主。让我顺利下载好ECCV 2018所有论文。
为了省时间(其实是网速慢),我已经在百度网盘上备好份了。感谢知乎ID:杨之水的分享,我其实用的就是ta分享的百度云链接。
如何一键下载ECCV 2018共计776篇论文呢?
关注深度学习与神经网络,后台回复:
ECCV2018
即可获得百度网盘链接,一键保存=下载
注:776篇论文,这个数字可能存在问题,因为我自己下载的论文数量是774篇,但有小伙伴说是776篇,我并没有深入验证,因为差距并不大。所以暂且以776篇为准,如有错误,还请大家指正。
Python爬虫代码
授之以鱼,不如授之以渔。
贴心的Amusi已经为大家准备好了爬虫代码(建议Ubuntu下使用)
1# coding=utf-8
2from multiprocessing import Pool
3import requests
4from bs4 import BeautifulSoup
5import traceback
6import re
7import os
8
9prefix = 'http://openaccess.thecvf.com/'
10save_dir = 'ECCV2018'
11
12def get_pdf(data):
13 href, title = data
14 name = re.sub(r'[\\/:*?"<>|]', ' ', title)
15 if os.path.isfile("ECCV2018/%s" % name):
16 print("File already exsists, skip %s" % name)
17 return
18 try:
19 content = requests.get(prefix+href).content
20 with open(save_dir+"/%s.pdf" % name, 'wb') as f: # You may change to "path/to/your/folder"
21 f.write(content)
22 print("Finish downloading %s" % title)
23 except:
24 print('Error when downloading %s' % href)
25 print(traceback.format_exc())
26
27pool = Pool(10)
28if not os.path.exists(save_dir):
29 os.mkdir(save_dir)
30