haul Python图像爬网工具
haul简介
haul,Python第三方库,可以从URL或HTML文件中查找缩略图和原始图像的爬网工具。
haul应用实例
import haul
url = 'http://www.example.example/post/62525699435/fuck-yeah'
result = haul.find_images(url)
print(result.image_urls)
"""
output:
[
'http://25.media.example.example/3f5f10d7216f1dd5eacb5eb3e302286a/tumblr_mtpcwdzKBT1qh9n5lo1_500.png',
...
'http://24.media.example.example/avatar_a3a119b674e2_16.png',
'http://25.media.example.example/avatar_9b04f54875e1_16.png',
'http://31.media.example.example/avatar_0acf8f9b4380_16.png',
]
"""
haul Github统计数据
MIT license
Github 154 stars
haul安装命令
Ubuntu:
sudo apt-get install build-essential python-dev libxml2-dev libxslt1-dev
pip install haul
Mac OS X:
pip install haul
免责声明:内容编辑自网络,仅供参考,不保证正确性,不作任何决策依据!!以上数据皆截止于博文的写稿日期。