您现在的位置是：亿华云 > 人工智能

一行代码搞定 Scrapy 随机 User-Agent

亿华云2025-10-04 03:43:07【人工智能】6人已围观

简介编辑：zone投稿：苏克1900摘要：爬虫过程中的反爬措施非常重要，其中设置随机 User-Agent 是一项重要的反爬措施，Scrapy 中设置随机 UA 的方式有很多种，有的复杂有的简单，本文就对

编辑：zone

投稿：苏克1900

摘要：爬虫过程中的行代反爬措施非常重要，其中设置随机 User-Agent 是码搞一项重要的反爬措施，Scrapy 中设置随机 UA 的行代方式有很多种，有的码搞复杂有的简单，本文就对这些方法进行汇总，行代提供一种只需要一行代码的码搞设置方式。

最近使用 Scrapy 爬一个网站，行代遇到了网站反爬的码搞情况，于是行代开始搜索一些反爬措施，了解到设置随机 UA 来伪装请求头是码搞一种常用的方式，这能够做到一定程度上避免网站直接识别出你是行代一个爬虫从而封掉你。设置随机 UA 的码搞方法有挺多种，有的行代需要好多行代码，有的码搞却只需要一行代码就搞定了，接下来就来介绍下。行代

▌常规设置 UA

首先，说一下常规情况不使用 Scrapy 时的用法，比较方便的云南idc服务商方法是利用 fake_useragent包，这个包内置大量的 UA 可以随机替换，这比自己去搜集罗列要方便很多，下面来看一下如何操作。

首先，安装好fake_useragent包，一行代码搞定：

pip install fake-useragent

然后，就可以测试了：

1from fake_useragent import

UserAgent

ua = UserAgent()

3for i in range(10

print(ua.random)

这里，使用了 ua.random 方法，可以随机生成各种浏览器的 UA，见下图：

（放大查看）

如果只想要某一个浏览器的，比如 Chrome ，那可以改成 ua.chrome，再次生成随机 UA 查看一下：

以上就是常规设置随机 UA 的一种方法，非常方便。

下面，我们来介绍在 Scrapy 中设置随机 UA 的几种方法。

先新建一个 Project，命名为 wanojia，测试的网站选择为：http://httpbin.org/get。

首先，我们来看一下，如果不添加 UA 会得到什么结果，可以看到显示了scrapy，这样就暴露了我们的源码库爬虫，很容易被封。

下面，我们添加上 UA 。

▌直接设置 UA

第一种方法是和上面程序一样，直接在主程序中设置 UA，然后运行程序，通过下面这句命令可以输出该网站的 UA，见上图箭头处所示，每次请求都会随机生成 UA，这种方法比较简单，但是每个 requests 下的请求都需要设置，不是很方便，既然使用了 Scrapy，它提供了专门设置 UA 的地方，所以接下来我们看一下如何单独设置 UA。

1response.request.headers[User-Agent

]