电脑知识
小孩学的编程是什么概念(小孩学编程是学什么)
2023-04-12 10:15

以下是一个简单的Python爬虫代码,可以从网易云音乐网站上爬取歌曲的基本信息(包括歌名、歌手和专辑名称):

import requests

from bs4 import BeautifulSoup

# 定义请求头

headers = {

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}

# 定义要爬取的网页链接

url = '网页链接'

# 发送请求

response = requests.get(url, headers=headers)

# 解析HTML页面

soup = BeautifulSoup(response.text, 'html.parser')

# 查找所有的歌曲列表

song_list = soup.find_all('ul', class_='f-hide')[0].find_all('a')

# 遍历歌曲列表,输出歌名、歌手和专辑名称

for song in song_list:

song_name = song.text

song_url = '网页链接' + song['href']

song_response = requests.get(song_url, headers=headers)

song_soup = BeautifulSoup(song_response.text, 'html.parser')

artist = song_soup.find_all('p', class_='des s-fc4')[0].find_all('span')[0].find_all('a')[0].text

album = song_soup.find_all('p', class_='des s-fc4')[0].find_all('span')[1].find_all('a')[0].text

print('歌曲名称:', song_name)

print('歌手:', artist)

print('专辑名称:', album)

在代码中,首先定义了请求头和要爬取的网页链接,然后使用requests库发送HTTP请求,并使用BeautifulSoup库解析返回的HTML页面。接下来,查找HTML页面中所有的歌曲列表,遍历歌曲列表,对于每个歌曲,通过获取其链接,发送新的请求并解析返回的HTML页面,查找并输出歌手和专辑名称。最后,输出结果。

网页链接

发表评论
0评