专栏名称: Dance with GenAI

关于生成式人工智能AIGC的一切

AI批量下载网页中的mp3音频

Dance with GenAI · 公众号 · · 2025-01-18 06:56

正文

这个网页中有多个mp3音频 https://www. barefootbooks.com/tales ofmystery

查看源代码，找到mp3文件：

https:// barefootbooks-media-raw.s3.amazonaws.com /audio/TalesOfMysteryAndMagic/TalesofMysteryandMagic_2_TheBlackbirdandhisWife.mp3

https://barefootbooks-media-raw.s3.amazonaws.com /audio/TalesOfMysteryAndMagic/TalesofMysteryandMagic_2_TheBlackbirdandhisWife.mp3 " type="audio/mpeg">

Your browser does not support the audio element.

在deepseek中输入提示词：

你是一个Python编程专家，写一个Python脚本，完成任务如下：

打开网页： https://www. barefootbooks.com/tales ofmystery

定位源代码中所有audio标签，然后定位其中的标签，提取其src属性，这是MP3下载链接；

下载所有的mp3音频，保存到文件夹：F:\aivideo

注意：每一步都要输出信息到屏幕上

要完成这个任务，我们可以使用Python的requests库来下载网页内容，使用BeautifulSoup库来解析HTML并提取所需的音频链接，最后使用requests库来下载这些MP3文件。以下是一个完整的Python脚本：

import os

import requests

from bs4 import BeautifulSoup

# 定义目标网页和保存路径

url = " https://www. barefootbooks.com/tales ofmystery "

save_folder = r"F:\aivideo"

# 确保保存文件夹存在

if not os.path.exists(save_folder):

os.makedirs(save_folder)

print(f"Created folder: {save_folder}")

# 下载网页内容

print(f"Fetching content from {url}...")

response = requests.get(url)

response.raise_for_status() # 检查请求是否成功

# 解析HTML内容

print("Parsing HTML content...")

soup = BeautifulSoup(response.text, 'html.parser')

# 查找所有的

audio_tags = soup.find_all('audio')

print(f"Found {len(audio_tags)}

# 遍历每个

mp3_links = []

for audio in audio_tags:

source_tags = audio.find_all('source')

for source in source_tags:

src = source.get('src')

if src and src.endswith('.mp3'):

mp3_links.append(src)

print(f"Found MP3 link: {src}")

# 下载所有的MP3文件

for mp3_link in mp3_links:

print(f"Downloading {mp3_link}...")

mp3_response = requests.get(mp3_link)

mp3_response.raise_for_status()

# 提取文件名

file_name = os.path.join(save_folder, os.path.basename(mp3_link))

# 保存文件

with open(file_name, 'wb') as f:

请到「今天看啥」查看全文

推荐文章

APPSO · 最低调的「AI 六小龙」阶跃星辰，在 DeepSeek 浪潮中交出了一份新答卷

10 小时前

界面新闻 · 宗馥莉接手娃哈哈创投公司

15 小时前

界面新闻 · 传日本财团起草特斯拉投资日产汽车的计划

17 小时前

界面新闻 · 超越ChatGPT，马斯克的Grok升至苹果美区免费APP榜首

昨天

APPSO · 实测马斯克口中最聪明的 AI，就这？

3 天前

关爱八卦成长协会 · 鸡排哥回来啦！！！！还要给你们发福利！！！！

8 年前

投行观察 · BAT齐聚深圳！三巨头讲话流出！投行、投资选企业看这一篇就够了！

7 年前

澄泓财经 · 保险股真的能保平安吗？

7 年前

精英点评江西 · 堪比美国Coachella（科切拉）电音运动！在南昌？震撼~棒！震撼~棒！

7 年前

知日 · 做得漂亮不如做得有趣，日本最酷的企业内刊就是它！

7 年前