转载:HTTP Referer 教程 - 阮一峰的网络日志
HTTP 请求的头信息里面, Referer
是一个常见字段,提供访问来源的信息。
很多开发者知道这个字段,但是说不清它的具体细节。本文详细介绍该字段。
# 一、Referer 的含义
现实生活中,购买服务或加入会员的时候,往往要求提供信息:“你从哪里知道了我们?”
这叫做引荐人(referrer),谁引荐了你?对于公司来说,这是很有用的信息。
互联网也是一样,你不会无缘无故访问一个网页,总是有人告诉你,可以去那里看看。服务器也想知道,你的 "引荐人" 是谁?
HTTP 协议在请求(request)的头信息里面,设计了一个 Referer
字段,给出 "引荐网页" 的 URL。
这个字段是可选的。客户端发送请求的时候,自主决定是否加上该字段。
很有趣的是,这个字段的拼写是错的。 Referer
的正确拼写是 Referrer
,但是写入标准的时候,不知为何,没人发现少了一个字母 r
。标准定案以后,只能将错就错,所有头信息的该字段都一律错误拼写成 Referer
。
# 二、Referer 的发生场景
浏览器向服务器请求资源的时候, Referer
字段的逻辑是这样的,用户在地址栏输入网址,或者选中浏览器书签,就不发送 Referer
字段。
主要是以下三种场景,会发送 Referer
字段。
(1)用户点击网页上的链接。
(2)用户发送表单。
(3)网页加载静态资源,比如加载图片、脚本、样式。
1 | <!-- 加载图片 --> |
上面这些场景,浏览器都会将当前网址作为 Referer
字段,放在 HTTP 请求的头信息发送。
浏览器的 JavaScript 引擎提供 document.referrer
属性,可以查看当前页面的引荐来源。注意,这里采用的是正确拼写。
# 三、Referer 的作用
Referer
字段实际上告诉了服务器,用户在访问当前资源之前的位置。这往往可以用来用户跟踪。
一个典型的应用是,有些网站不允许图片外链,只有自家的网站才能显示图片,外部网站加载图片就会报错。它的实现就是基于 Referer
字段,如果该字段的网址是自家网址,就放行。
由于涉及隐私,很多时候不适合发送 Referer
字段。
这里举两个例子,都不适合暴露 URL。一个是功能 URL,即有的 URL 不要登录,可以访问,就能直接完成密码重置、邮件退订等功能。另一个是内网 URL,不希望外部用户知道内网有这样的地址。 Referer
字段很可能把这些 URL 暴露出去。
此外,还有一种特殊情况,需要定制 Referer
字段。比如社交网站上,用户在对话中提到某个网址。这时,不希望暴露用户所在的原始网址,但是可以暴露社交网站的域名,让对方知道,是我贡献了你的流量。
# 四、 rel
属性
由于上一节的原因,浏览器提供一系列手段,允许改变默认的 Referer
行为。
对于用户来说,可以改变浏览器本身的全局设置,也可以安装浏览器扩展。这里就不详细介绍了。
对于开发者来说, rel="noreferrer"
属性是最简单的一种方法。 <a>
、 <area>
和 <form>
三个标签可以使用这个属性,一旦使用,该元素就不会发送 Referer
字段。
1 | <a href="..." rel="noreferrer" target="_blank">xxx</a> |
上面链接点击产生的 HTTP 请求,不会带有 Referer
字段。
注意, rel="noreferrer"
采用的是正确的拼写。
# 五、Referrer Policy 的值
rel
属性只能定制单个元素的 Referer
行为,而且选择比较少,只能发送或不发送。W3C 为此制定了更强大的 Referrer Policy。
Referrer Policy 可以设定 8 个值。
(1)no-referrer
不发送
Referer
字段。(2)no-referrer-when-downgrade
如果从 HTTPS 网址链接到 HTTP 网址,不发送
Referer
字段,其他情况发送(包括 HTTP 网址链接到 HTTP 网址)。这是浏览器的默认行为。(3)same-origin
链接到同源网址(协议 + 域名 + 端口 都相同)时发送,否则不发送。注意,
https://foo.com
链接到http://foo.com
也属于跨域。(4)origin
Referer
字段一律只发送源信息(协议 + 域名 + 端口),不管是否跨域。(5)strict-origin
如果从 HTTPS 网址链接到 HTTP 网址,不发送
Referer
字段,其他情况只发送源信息(协议 + 域名 + 端口)。(6)origin-when-cross-origin
同源时,发送完整的
Referer
字段,跨域时发送源信息(协议 + 域名 + 端口)。(7)strict-origin-when-cross-origin
同源时,发送完整的
Referer
字段;跨域时,如果 HTTPS 网址链接到 HTTP 网址,不发送Referer
字段,否则发送源信息(协议 + 域名 + 端口)。(8)unsafe-url
Referer
字段包含源信息(协议 + 域名 + 端口)、路径和查询字符串,不包含锚点、用户名和密码。
# 六、Referrer Policy 的用法
Referrer Policy 有多种使用方法。
(1)HTTP 头信息
服务器发送网页的时候,通过 HTTP 头信息的 Referrer-Policy
告诉浏览器。
1 | Referrer-Policy: origin |
(2) <meta>
标签
也可以使用 <meta>
标签,在网页头部设置。
1 | <meta name="referrer" content="origin" /> |
(3)referrerpolicy 属性
<a>
、 <area>
、 <img>
、 <iframe>
和 <link>
标签,可以设置 referrerpolicy 属性。
1 | <a href="..." referrerpolicy="origin" target="_blank">xxx</a> |
# 七、退出页面重定向
还有一种比较老式的技巧,但是非常有效,可以隐藏掉原始网址,谷歌和 Facebook 都在使用这种方法。
链接的时候,不要直接跳转,而是通过一个重定向网址,就像下面这样。
1 | <a href="/exit.php?url=http%3A%2F%2Fexample.com">Example.com</a> |
上面网址中,先跳转到 /exit.php
,然后再跳转到目标网址。这时, Referer
字段就不会包含原始网址。
# Comments
设置 <img>
标签的 referrerpolicy="unsafe-url"
可以看到 Referer
请求字段不仅包含源信息(协议 + 域名 + 端口)、同时包含路径 test.html
.
test.html
1 |
|