nba的素材可以去哪些平台找(朋友很喜欢打篮球,我用Python爬取了1000张他喜欢的NBA球星图片)
更新时间:2022-09-11 05:27:02前言
朋友快过生日了,不知道送啥礼物【绝对不是因为我抠】,想着他非常喜欢打篮球,篮球他很多个了,应该也不会缺【不会是因为篮球贵】,那我就用技术白嫖点东西送给他吧,爬虫首当其冲呀,必须安排一波,于是我的灵感来了,爬取一波他喜欢的NBA球星图片送给他,再整点活合作一张大图,那效果不就出来了,这波真不错【辣条送礼物提示:送好朋友或者男女朋友礼物,不要只看价格,要看对方需要什么想要什么,礼轻情意重,主要是省钱…】
爬取目标
网址:百度一下
私信小编01即可获取大量Python学习资源
效果展示
工具准备
开发工具:Visual Studio Code
开发环境:python3.7, Windows10
使用工具包:requests
项目解析思路
获取当当前网页的跳转地址,当前页面为主页面数据,我们需要的数据别有一番天地,获取到网页信息提取出所有的跳转地址,获取到源码里的a标签就行当前网页的加载方式为静态数据,直接请求网页地址;
url = 'image.baidu/search/acjson?
从源代码里提取到所以的跳转地址
【这是个很简单的代码,不做详细思路解析了,平台对爬虫的文章的审核比以前严格很多了,代码我留着,有啥不懂的评论提出,或者私信我,我看到了都会解答】
简易源码分享
import requests import json import time import os def crawl(page): if not os.path.exists('D://111'): os.mkdir('D://111') url = 'image.baidu/search/acjson?' header = { # 'Referer': 'image.baidu/search/index?ct=201326592cl=2st=-1lm=-1nc=1ie=utf-8tn=baiduimageipn=rrps=1pv=fm=rs4word', 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36' } param = { "tn": "resultjson_com", "logid": "11007362803069082764", "ipn": "rj", "ct": "201326592", "is": "", "fp": "result", "queryWord": "NBA", "cl": "2", "lm": "-1", "ie": "utf-8", "oe": "utf-8", "adpicid": "", "st": "-1", "z": "", "ic": "", "hd": "", "latest": "", "copyright": "", "word": "NBA", "s": "", "se": "", "tab": "", "width": "", "height": "", "face": "0", "istype": "2", "qc": "", "nc": "1", "fr": "", "expermode": "", "force": "", "pn": page, "rn": "30", "gsm": "1e", "1615565977798": "", } response = requests.get(url, headers=header, params=param) img = response.text j = json.loads(img) # print(j) img_list = for i in j: #获得j字典数据里面的data所对应的值 值是一个列表 通过for循环拿去列表里的每一个元素 if 'thumbURL' in i: # print(i) img_list.append(i) #追加到列表中 print(len(img_list)) #打印URL的数量 for count,n in enumerate(img_list): r = requests.get(n, headers=header) with open(f'D://111/{count 1}.jpg', 'wb') as f: f.write(rntent) # count = 1 # if __name__ == '__main__': for i in range(30, 61, 10): #起始值 终点值 步长 t1 = time.time() crawl(i) t2 = time.time() t = t2 - t1 print(f'page {i//30} is over!!! 耗时{t:.2f}秒!') #.2f两位小数
相关推荐
- 最新资讯
-
- 2022-11-18 电竞宣萱(“吃鸡”呆萌和书生组合果然是无敌,真的是钢枪组合,所向无敌)
- 2022-11-15 实况足球曼联时刻测评(实况足球:曼联传奇——吉格斯测评)
- 2022-11-15 迭戈-科斯塔将在今夏离开马竞(官方:马竞宣布与迭戈-科斯塔解约)
- 2022-11-15 皮克就是罚款大户(皮克狂炸了赛场公开出言讽刺西甲主席 大嘴或被追加停赛)
- 2022-11-15 lol官网(10年前的LOL官网:只有40名英雄,那时候盖伦都还没上线)
- 2022-11-15 巴西对秘鲁角球数(巴西8强战存一大隐患!主力后腰累积黄牌停赛,后防将经受考验)
- 2022-11-15 张效瑞沈祥福能给深足提供帮助(张效瑞确认沈祥福出任深足教练组组长:训练和临场指挥均由他负责)
- 2022-11-15 葡萄牙vs乌拉圭首发(出战世界杯稳了!孙准浩替补踢半场长传成功率高 一优势有望获重用)
- 2022-11-15 湖人vs步行者全场回放2020(詹姆斯暴砍39分,湖人队加时124-116击败步行者)
- 2022-11-15 尤文逼和国际米兰(欧洲足坛疯狂一夜:阿森纳巴黎全胜,尤文2-0国米,曼联爆冷输球)
- 推荐攻略
-
-
乌克兰总统身亡(乌总统泽连斯基解除乌总检察长及国家安全局局长职务)
-
足球比赛每个半场多少分钟(足球比赛每半场几分钟)
-
2021中超今天哪里转播(今晚!中超2场对决,CCTV5 直播申花PK武汉,腾讯体育亚泰vs天津)
-
2022梅西坠机身亡事件结果(足坛变天!巴萨无缘榜首的2年:梅西告别,老马去世,2-8惨案)
-
2021全运会篮球直播赛程辽宁(4月22日央视直播:CBA总决赛;赵心童vs马奎尔,塞尔比vs颜丙涛)
-
中国最强导弹(世界洲际导弹前10排名,中国东风导弹领先美国,第一名堪称导弹王)
-
2021篮球比赛在哪里看(CCTV5直播NBA 辽篮争夺CBA总决赛冠军点 颜丙涛出战斯诺克世锦赛)
-
东航结果不敢公布了(民航局再次回应东航MU5735事故调查!查明原因有多难,多久公布?)
-