Python爬取Telegra图片

博主： mazzz
发布时间：2024 年 09 月 06 日
4951 次浏览
7 条评论
2086字数
分类：编程

<div class="entry-content l-h-2x" id="md_handsome_origin"><h2>安装依赖</h2><p>其他依赖请自行安装</p><pre><code class="lang-bash">pip install urllib
pip install lxml
pip install alive_progress</code></pre><h2>代码</h2><pre><code class="lang-python">import os
import urllib
import requests
from lxml import etree
from alive_progress import alive_bar

'''
Auth:Kenvie
Date:2022/08/13
Desc:爬取 telegra.ph 图片
'''

print('*********************************************************')
print('                  爬取  telegra.ph  图片                   ')
print('                       Auth:Kenvie                       ')
print('                     Blog: kenvie.com                    ')
print('*********************************************************')
print('                            *                            ')
print('            链接格式：https://telegra.ph/*********         ')
print('                            *                            ')
print('*********************************************************')
url = input("请输入超链接：")
name = urllib.parse.unquote(url)[19:]  # 获取文件夹名字
print(' ')
Folder = input("请输入存储路径：")  # 存储路径
PATH = Folder+'\\'+name+'\\'  # 拼接 存储路径+文件夹名字   图片存放位置
isexist = os.path.exists(PATH)  # 判断路径在不在
if not isexist:
    os.mkdir(PATH)  # 如果不在就创建
else:
    print("目录已存在，以存入"+PATH)  # 如果存在就存入
URL = 'https://telegra.ph/'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36'
}
r = requests.get(url=url, headers=headers)
html = etree.HTML(r.text)   # 接收request数据
data_list = html.xpath('//img/@src')
print('存储路径为：'+PATH)
print('*********************************************************')
print(' ')
with alive_bar(len(data_list)) as bar:
    for data in data_list:
        data1 = str(data)
        file_url = URL+data1
        data2 = requests.get(url=file_url, headers=headers).content
        file_name = str(data1).split('/')[-1].split('.')[0]
        file_path = PATH + file_name+'.jpg'
        with open(file_path, 'wb') as f:
            f.write(data2)
        bar()
print('下载已结束!')
print(' ')
print('存储目录为:'+PATH)
os.system(f'explorer /select, {PATH}')</code></pre></div>

安装依赖

其他依赖请自行安装

pip install urllib
pip install lxml
pip install alive_progress

代码

import osimport urllib
import requests
from lxml import etree
from alive_progress import alive_bar
'''
Auth:Kenvie
Date:2022/08/13
Desc:爬取 telegra.ph 图片
'''
print('*')
print('                  爬取  telegra.ph  图片                   ')
print('                       Auth:Kenvie                       ')
print('                     Blog: kenvie.com                    ')
print('*')
print('                            *                            ')
print('            链接格式：https://telegra.ph/*         ')
print('                            *                            ')
print('*')
url = input("请输入超链接：")
name = urllib.parse.unquote(url)[19:]  # 获取文件夹名字
print(' ')
Folder = input("请输入存储路径：")  # 存储路径
PATH = Folder+'\'+name+'\'  # 拼接 存储路径+文件夹名字   图片存放位置
isexist = os.path.exists(PATH)  # 判断路径在不在
if not isexist:
os.mkdir(PATH)  # 如果不在就创建
else:
print(&quot;目录已存在，以存入&quot;+PATH)  # 如果存在就存入
URL = 'https://telegra.ph/'
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36'
}
r = requests.get(url=url, headers=headers)
html = etree.HTML(r.text)   # 接收request数据
data_list = html.xpath('//img/@src')
print('存储路径为：'+PATH)
print('*')
print(' ')
with alive_bar(len(data_list)) as bar:
for data in data_list:
    data1 = str(data)
    file_url = URL+data1
    data2 = requests.get(url=file_url, headers=headers).content
    file_name = str(data1).split('/')[-1].split('.')[0]
    file_path = PATH + file_name+'.jpg'
    with open(file_path, 'wb') as f:
        f.write(data2)
    bar()print('下载已结束!')
print(' ')
print('存储目录为:'+PATH)
os.system(f'explorer /select, {PATH}')

最后修改：2024 年 09 月 06 日

如果觉得我的文章对你有用，请随意赞赏

7 条评论

鍗庣撼鍏徃鍚堜綔寮€鎴锋墍闇€鏉愭枡锛熺數璇濆彿鐮?5587291507 寰俊STS5099
November 7th, 2025 at 01:32 pm

华纳万宝路客服电话是多少？（?183-8890-9465—《?薇-STS5099】【?扣6011643??】
华纳万宝路开户专线联系方式？（?183-8890--9465—《?薇-STS5099】【?扣6011643??】
华纳圣淘沙客服开户电话全攻略，让娱乐更顺畅！（?183-8890--9465—《?薇-STS5099】客服开户流程，华纳圣淘沙客服开户流程图（?183-8890--9465—《?薇-STS5099】

回复
鍗庣撼鍏徃鍚堜綔寮€鎴锋墍闇€鏉愭枡锛熺數璇濆彿鐮?5587291507 寰俊STS5099
November 6th, 2025 at 02:38 pm

华纳客服开户流程，华纳客服开户流程图（?183-8890--9465—《?薇-STS5099】

回复
鍗庣撼鍏徃鍚堜綔寮€鎴锋墍闇€鏉愭枡锛熺數璇濆彿鐮?5587291507 寰俊STS5099
November 2nd, 2025 at 10:44 pm

华纳东方明珠客服电话是多少？（??155--8729--1507?《?薇-STS5099】【?扣6011643?】
华纳东方明珠开户专线联系方式？（??155--8729--1507?《?薇-STS5099】【?扣6011643?】

回复
鍗庣撼鍏徃鍚堜綔寮€鎴锋墍闇€鏉愭枡锛熺數璇濆彿鐮?5587291507 寰俊STS5099
November 2nd, 2025 at 01:26 pm

华纳东方明珠客服电话是多少？（▲18288362750?《?微信STS5099? 】
如何联系华纳东方明珠客服？（▲18288362750?《?微信STS5099? 】
华纳东方明珠官方客服联系方式？（▲18288362750?《?微信STS5099?
华纳东方明珠客服热线？（▲18288362750?《?微信STS5099?
华纳东方明珠24小时客服电话？（▲18288362750?《?微信STS5099? 】
华纳东方明珠官方客服在线咨询？（▲18288362750?《?微信STS5099?

回复
鍗庣撼鍏徃鍚堜綔寮€鎴锋墍闇€鏉愭枡锛熺數璇濆彿鐮?5587291507 寰俊STS5099
November 1st, 2025 at 12:53 pm

华纳东方明珠客服微信？（▲18288362750?《?微信STS5099? 】【╃q 2704132802╃】

回复
cgzesulext
October 7th, 2025 at 09:53 am

2025年10月新盘做第一批吃螃蟹的人coinsrore.com
新车新盘嘎嘎稳嘎嘎靠谱coinsrore.com
新车首发，新的一年，只带想赚米的人coinsrore.com
新盘上车集合留下我要发发立马进裙coinsrore.com
做了几十年的项目我总结了最好的一个盘（纯干货）coinsrore.com
新车上路，只带前10个人coinsrore.com
新盘首开新盘首开征召客户！！！coinsrore.com
新项目准备上线，寻找志同道合的合作伙伴coinsrore.com
新车即将上线真正的项目，期待你的参与coinsrore.com
新盘新项目，不再等待，现在就是最佳上车机会！coinsrore.com
新盘新盘这个月刚上新盘新车第一个吃螃蟹！coinsrore.com

回复
iahtuyvjpq
October 4th, 2025 at 11:51 pm

新盘上车集合留下我要发发立马进裙coinsrore.com

回复