目录
python爬虫:设置随机 User-Agent可以使用模块 fake-useragent。
这个包从useragentstring.com和w3schools.com获取相关数据,可以随机大量User-Agent数据使用,比自己去整理ua信息使用会方便很多。
模块安装和使用。
fake-useragent模块github地址:
https://github.com/hellysmile/fake-useragent
安装模块
pip install fake-useragent
更新模块
pip install -U fake-useragent
查看版本
import fake_useragent
print(fake_useragent.VERSION)
使用
随机生成UA
# 导入模块
from fake_useragent import UserAgent
# 实例化
ua = UserAgent()
# 生成随机UA
# 使用ua.random 方法,既可以随机生成各种浏览器的 UA。
uaeragent = ua.random
print(ua)
# 使用for循环生成十个随机useragent
for i in range(10):
print(ua.random)
生成指定浏览器UA
# 导入模块
from fake_useragent import UserAgent
# 实例化
ua = UserAgent()
# 可以指定自己的浏览器列表,可以通过参数browsers(默认值为:browsers["chrome", "edge", "internet explorer", "firefox", "safari", "opera"])执行此操作。
# 指定获取edge Chrome
ua = UserAgent(browsers=['edge', 'chrome'])
ua.random
直接获取单个浏览器UA
# 导入模块
from fake_useragent import UserAgent
# 实例化
ua = UserAgent()
ua.ie # ie浏览器
# Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US);
ua.chrome # chrome浏览器
# Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML, like Gecko) Chrome/22.0.1216.0 Safari/537.2'
# 其他浏览器
ua.msie
# Mozilla/5.0 (compatible; MSIE 10.0; Macintosh; Intel Mac OS X 10_7_3; Trident/6.0)'
ua['Internet Explorer']
# Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; GTB7.4; InfoPath.2; SV1; .NET CLR 3.3.69573; WOW64; en-US)
ua.opera
# Opera/9.80 (X11; Linux i686; U; ru) Presto/2.8.131 Version/11.11
ua.google
# Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4) AppleWebKit/537.13 (KHTML, like Gecko) Chrome/24.0.1290.1 Safari/537.13
ua['google chrome']
# Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11
ua.firefox
# Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:16.0.1) Gecko/20121011 Firefox/16.0.1
ua.ff
# Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:15.0) Gecko/20100101 Firefox/15.0.1
ua.safari
# Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25
# 我们可以看出