博客

DoH与DoT:DNS查询的隐形斗篷

前言:互联网的“电话簿”与它的“公开秘密” #

我们每打开一个网站,看似简单的操作背后,都离不开一个核心服务的支撑——域名系统(DNS)。你可以将DNS比作互联网的“电话簿”,它负责将我们易于记忆的域名(如feige301.com)翻译成机器可识别的IP地址(如192.0.2.1),从而引导我们的设备找到正确的服务器。没有DNS,互联网将寸步难行。

然而,这个至关重要的“电话簿”服务,长期以来却存在一个“公开的秘密”:传统的DNS查询是未经加密的。这就好比你每次查电话号码,都要通过一张明信片发送请求,所有人都能看到你查询了什么号码,以及谁回复了你。这种明文传输的特性,使得DNS查询极易受到各种形式的监听、篡改和劫持。

在复杂的网络环境中,这种脆弱性导致了一系列困扰网站管理员和用户的难题:

  • 域名污染(Domain Pollution):恶意或非恶意的中间设备,通过篡改DNS响应,将用户导向错误的IP地址,导致网站无法访问或被劫持到钓鱼页面。
  • ISP劫持(ISP Hijacking):某些运营商或网络服务提供商,出于各种目的(如插入广告、限制访问),在DNS层面篡改用户的查询结果,影响用户体验和网站的正常运营。
  • 区域性网络封锁(Regional Network Blocking):在特定网络区域内,通过对传统DNS查询的识别和干预,阻止用户访问某些域名,造成连通性障碍。

这些问题不仅损害了用户的上网体验,也给网站运营者带来了巨大的挑战:流量无故流失、用户信任度下降、安全风险增加,甚至直接影响商业利益。在这样的背景下,寻找一种能够保护DNS查询隐私和完整性的技术方案,成为了网络安全领域的重要议题。这正是我们今天要深入探讨的DoT(DNS over TLS)和DoH(DNS over HTTPS)技术诞生的核心驱动力。它们旨在为DNS查询披上一层“隐形斗篷”,使其在复杂的网络环境中能够安全、私密地穿梭。

传统DNS:明文传输的“软肋” #

在深入了解DoT和DoH之前,我们有必要回顾一下传统的DNS工作方式。当你在浏览器中输入一个域名时,你的操作系统会首先向本地配置的DNS服务器(通常是你的路由器或网络服务提供商提供的服务器)发送一个DNS查询请求。这个请求通常使用UDP协议,通过53端口进行传输。

整个查询过程是明文的,这意味着在你的设备和DNS服务器之间的任何“中间设备”——例如你家里的路由器、你所在局域网的流量网关,甚至是某地区运营商的DPI(深度包检测)设备——都能够轻松地读取你的DNS查询内容(你访问了哪个域名)和DNS服务器的响应(这个域名对应的IP地址)。

这种明文传输的特性,虽然在互联网早期提供了高效便捷的服务,但在当今对隐私和安全日益重视的时代,却成为了一个明显的“软肋”:

  1. 隐私泄露风险:你的上网行为轨迹,通过DNS查询记录一览无余。第三方可以根据这些记录分析你的兴趣、习惯,甚至用于精准广告投放或更敏感的数据收集。
  2. 篡改与劫持威胁:由于缺乏加密和身份验证机制,恶意的“中间设备”可以轻易地拦截你的DNS查询,并返回一个伪造的IP地址。这会导致用户访问错误的网站(例如钓鱼网站),或者被重定向到非预期的页面。这就是“域名污染”和“ISP劫持”的常见技术实现方式之一。
  3. 内容过滤与审查:在某些“局部局域网环境”中,流量网关或DPI设备可以识别并过滤特定的DNS查询,从而阻止用户访问某些域名。这种基于DNS的过滤机制,是实现“区域性网络封锁”的一种有效且成本较低的手段。

对于网站管理员和运维人员而言,这意味着即使他们的网站服务器本身配置安全,也可能因为DNS层面的问题导致用户无法访问。解决这一“软肋”,成为了网络安全演进的必然趋势。

隐私与完整性的追求:DoT与DoH的崛起 #

为了应对传统DNS的这些安全与隐私挑战,互联网工程任务组(IETF)相继推出了两种加密DNS查询的新协议:DoT(DNS over TLS)和DoH(DNS over HTTPS)。它们的核心目标都是为DNS查询提供加密保护,确保查询内容不被窃听,响应结果不被篡改。

DoT(DNS over TLS):加密的直连通道 #

DoT,即DNS over TLS,顾名思义,它将DNS查询封装在TLS(传输层安全协议)之上。TLS是当前互联网上广泛用于加密通信的协议,例如我们访问HTTPS网站时,就是通过TLS来保障数据安全的。

工作原理: DoT协议将传统的DNS查询数据包(通常是UDP 53端口)放入一个TLS加密隧道中,并通过TCP 853端口进行传输。这意味着你的DNS查询不再是明文的,而是经过加密的,只有你的设备和DoT服务器能够解密并读取内容。

优点:

  • 加密保护:防止“中间设备”监听你的DNS查询内容,保护用户隐私。
  • 身份验证:TLS协议提供了服务器身份验证机制,可以确保你连接的是合法的DoT服务器,而非伪造的恶意服务器,从而有效抵御DNS劫持。
  • 数据完整性:加密同时保障了数据传输的完整性,防止DNS响应被篡改。

局限性: 尽管DoT提供了强大的安全保障,但它也有其特点:

  • 专用端口:DoT使用专用的853端口。这意味着“中间设备”仍然可以通过识别这个端口来判断正在进行的是DNS查询,即使内容被加密,它们也知道这是一次DNS请求。在某些严格的“局部局域网环境”中,如果853端口被直接阻断,DoT服务将无法使用。
  • 流量特征:虽然内容加密,但DoT的流量模式和握手过程仍可能与其他HTTPS流量有所区别,理论上仍有可能被高级的DPI设备识别并进行针对性干预。

你可以将DoT想象成一个专为电话簿查询设计的加密信封,你把查询请求装进去,通过一个私密的邮递员(TLS)送到电话局。虽然邮递员知道你在查电话簿,但不知道具体查了谁,也无法篡改回复。

DoH(DNS over HTTPS):隐形斗篷下的秘密通信 #

DoH,即DNS over HTTPS,是另一种更具“隐蔽性”的加密DNS查询方式。它将DNS查询封装在标准的HTTPS(超文本传输安全协议)请求中,并通过TCP 443端口进行传输。

工作原理: DoH巧妙地将DNS查询伪装成普通的网页浏览请求。当你的设备发起一个DoH查询时,它实际上是向一个支持DoH的HTTPS服务器发送一个HTTPS GET或POST请求,而这个请求的URL或请求体中包含了DNS查询的信息。服务器收到请求后,解析出DNS查询,执行解析,然后将结果封装在HTTPS响应中返回。

**核心优势:**混淆与隐蔽

...

TLS的最后一块拼图:ECH(加密SNI)

今天,我们来聊一个看似深奥,实则与每一位网站管理员、运维工程师和开发者息息相关的技术话题:TLS的最后一块拼图——ECH(Encrypted Client Hello),即加密SNI。

背景:日益复杂的网络连通性挑战 #

在当今数字时代,网站的连通性是其生命线。然而,随着网络环境的复杂化,网站运营者常常面临各种意想不到的连接障碍。这些障碍不仅影响用户体验,更直接损害业务连续性和数据安全。其中,尤为突出的挑战来自以下几个方面:

  1. 区域性网络封锁: 特定网络区域内的用户可能无法访问某些域名,这并非因为服务器故障,而是由于网络路径中的“中间设备”对流量进行了识别和阻断。
  2. ISP劫持: 某些“某地区运营商”可能会在用户访问特定域名时,未经授权地将流量重定向到其他页面,甚至篡改内容,严重侵犯了用户和网站所有者的权益。
  3. 域名污染: 这是指DNS解析结果被篡改,导致用户请求的域名被解析到错误的IP地址,从而无法正常访问目标网站。

这些问题的根源,往往在于当前网络协议设计中某些“明文”元数据的暴露。尽管我们普遍采用TLS(传输层安全协议)来加密传输内容,确保数据在传输过程中的机密性和完整性,但在TLS握手阶段,一些关键信息却依然以明文形式传输,成为了“中间设备”进行识别和干预的突破口。

困境与痛点:明文SNI的阿喀琉斯之踵 #

想象一下,你正在给远方的朋友寄送一封加密的信件。信件内容被严密包裹,无人能窥视。但信封上,你却不得不清晰地写上收件人的姓名和地址。对于网络流量而言,TLS协议在加密数据内容方面做得非常出色,但它在握手阶段,尤其是早期版本中,却暴露了一个“信封上的地址”——这就是我们今天要重点讨论的SNI(Server Name Indication,服务器名称指示)字段。

在TLS 1.2及更早版本中,客户端在发起TLS握手时,会在ClientHello消息中包含一个SNI字段,明确告知服务器它希望访问哪个域名。这个设计是为了解决虚拟主机(Virtual Hosting)的问题:一台服务器上可能托管着成百上千个不同的网站,服务器需要知道客户端请求的是哪个域名,才能提供正确的TLS证书并建立连接。

然而,SNI的明文传输,成为了“中间设备”进行流量过滤和阻断的关键依据。这些“流量网关”或“DPI(深度包检测)设备”能够轻易地读取到用户正在尝试访问的域名。一旦某个域名被列入“关注列表”,这些设备便可以根据明文SNI信息,对相应的连接进行阻断、重置或重定向。

这给网站运营者带来了巨大的痛点:

  • 业务中断与用户流失: 对于“高并发商业站点”、“数字娱乐平台”等依赖稳定连接的业务而言,基于SNI的阻断意味着用户无法访问,直接导致流量损失、交易中断,甚至品牌声誉受损。
  • 安全隐患: ISP劫持者可以利用明文SNI来识别目标网站,进而实施各种中间人攻击或流量篡改,危及用户数据安全。
  • 运维成本增加: 为了应对这些阻断,网站管理员可能需要投入大量资源寻找替代域名、配置复杂的跳转规则,甚至部署昂贵的“隧道传输技术”,但这些方案往往治标不治本,且维护成本高昂。
  • 隐私泄露: 即使内容被加密,但用户访问了哪个网站这一元数据仍然对网络路径上的监听者可见,这严重侵犯了用户的上网隐私。

现有的解决方案,如DNS over HTTPS (DoH) 或 DNS over TLS (DoT),虽然能够加密DNS查询,防止DNS污染,但它们并不能解决SNI明文传输的问题。用户在进行DNS查询后,依然会在TLS握手时暴露目标域名。因此,我们需要一个更根本的解决方案,来加密这“TLS的最后一块明文拼图”。

正文:ECH——TLS的最后一块拼图 #

为了解决明文SNI带来的隐私和连通性问题,互联网工程任务组(IETF)一直在努力推进一项新技术:Encrypted Client Hello (ECH)。ECH是ESNI(Encrypted SNI)的演进版本,旨在将整个ClientHello消息(包括SNI)进行加密,从而彻底消除TLS握手阶段的明文元数据泄露。

1. TLS握手与SNI的运作原理回顾 #

在深入ECH之前,我们先快速回顾一下TLS握手的核心流程,以便更好地理解ECH所解决的问题:

  1. ClientHello (客户端问候): 客户端向服务器发送一个ClientHello消息,其中包含客户端支持的TLS版本、密码套件、随机数等信息。在TLS 1.2及更早版本中,这个消息中还会包含明文的SNI字段,告诉服务器它想要访问哪个域名。在TLS 1.3中,SNI仍是明文。
  2. ServerHello (服务器问候): 服务器收到ClientHello后,从中选择一个TLS版本和密码套件,并回复ServerHello消息,其中也包含服务器的随机数。
  3. 证书交换: 服务器发送其数字证书给客户端,客户端验证证书的有效性。
  4. 密钥交换: 客户端和服务器通过密钥交换算法(如Diffie-Hellman)协商出一个共享的会话密钥。
  5. 加密通信: 双方使用协商出的会话密钥对后续的应用层数据进行加密和解密。

从上述流程可以看出,ClientHello是整个TLS会话的起点,也是唯一在加密通信开始前,包含敏感域名信息(SNI)的明文消息。这就是“中间设备”进行识别和阻断的绝佳时机。

...

UDP的逆袭:QUIC协议与 HTTP/3

伴随互联网技术进步的,会有日益复杂的网络环境和层出不穷的连接挑战。今天,我想和大家聊聊一个曾经被视为“不可靠”的协议——UDP,是如何在QUIC协议的加持下,实现了一场华丽的逆袭,并为我们应对“区域性网络封锁”、“ISP劫持”等难题提供了新的思路。

问题的背景:传统协议的困境与用户痛点 #

在互联网的世界里,我们对速度和稳定性的追求永无止境。然而,当我们尝试访问一个全球性的“高并发商业站点”或“数字娱乐平台”时,却常常会遇到一些令人沮丧的问题:页面加载缓慢、图片无法显示,甚至连接中断。这背后,往往是复杂的网络环境在作祟。

传统的互联网通信基石是TCP/IP协议栈。TCP(传输控制协议)以其可靠性著称,通过三次握手建立连接,确保数据按序、完整地送达。然而,这种可靠性也带来了固有的开销。每一次连接建立、每一次数据包丢失后的重传,都需要额外的往返时间(Round-Trip Time, RTT)。在网络延迟较高或丢包率不稳定的“特定网络区域”,这些开销会被放大,导致用户体验显著下降。

更深层次的挑战来自网络中的“中间设备”和“DPI(深度包检测)设备”。这些设备在网络路径中扮演着流量网关的角色,它们能够识别、分析甚至干预网络流量。由于TCP和TLS(传输层安全协议)的握手过程具有相对固定的模式和可识别的特征,这些“中间设备”可以根据预设的规则对流量进行精细化管理,有时甚至会导致“ISP劫持”或无意的“区域性网络封锁”。例如,某些“局部局域网环境”可能会对特定协议或端口进行限制,导致合法的业务流量无法顺畅传输。

对于网站管理员、运维人员和开发者而言,这些问题直接转化为用户流失、业务受损的痛点。他们迫切需要一种更高效、更健壮、更难以被干扰的通信协议,来保障网站的全球可达性和用户体验。正是在这样的背景下,QUIC协议和HTTP/3应运而生。

TCP/IP协议栈的传统困境:为何我们需要变革? #

要理解QUIC的价值,我们首先需要回顾一下传统TCP和HTTP/2所面临的挑战。

  1. TCP的队头阻塞(Head-of-Line Blocking) TCP协议在传输数据时,为了保证可靠性和顺序性,会把所有数据流看作一个整体。如果一个数据包在传输过程中丢失,即使它后面的数据包已经到达,也必须等待丢失的包被重传并成功接收后,才能向上层应用交付。这就好比一条单车道,如果前面一辆车抛锚了,后面所有的车都得停下来等待,这就是“队头阻塞”。在HTTP/2中,虽然引入了多路复用,允许在同一TCP连接上同时发送多个请求和响应,但底层的TCP协议仍然存在队头阻塞问题。这意味着,如果一个HTTP/2流的数据包丢失,会阻塞该TCP连接上的所有其他HTTP/2流。

  2. 冗长的连接建立过程 一个典型的HTTPS连接需要经历两个串行的握手过程:

    • TCP三次握手: 客户端和服务器需要进行三次消息交换才能建立TCP连接。这至少需要一个RTT。
    • TLS握手: 在TCP连接建立之后,还需要进行TLS握手,以协商加密参数、交换证书和密钥。这通常需要两个RTT(对于TLS 1.2)或一个RTT(对于TLS 1.3)。 这意味着,一个全新的HTTPS连接,在真正传输应用数据之前,可能就需要消耗2到3个RTT。在网络延迟较高的场景下,这会显著增加页面的首次加载时间(TTFB, Time To First Byte)。
  3. 连接迁移的复杂性 传统的TCP连接由四元组(源IP、源端口、目的IP、目的端口)唯一标识。当用户从Wi-Fi切换到蜂窝网络时,其IP地址会发生变化,导致TCP连接中断,需要重新建立所有连接。这对于移动设备用户来说,意味着中断和延迟。

  4. 对中间设备的可见性与脆弱性 TCP和TLS协议的报文结构相对固定,握手过程也具有明显的特征。这使得“DPI设备”可以很容易地识别出TLS握手、HTTP请求等信息。虽然TLS加密了应用数据,但它并不能完全隐藏连接的元数据(如服务器名称指示SNI)。在某些“流量网关”或“中间设备”的配置下,这些可识别的特征可能被用于进行“区域性网络封锁”或“ISP劫持”,从而干扰正常的网络通信。

这些固有的问题,使得我们急需一种全新的传输协议来打破僵局。

UDP:被低估的潜力 #

长期以来,UDP(用户数据报协议)在传输层中常被视为TCP的“简化版”或“不可靠版”。它不建立连接、不保证数据顺序、不进行重传,因此被广泛应用于对实时性要求高但对少量丢包不敏感的场景,如在线游戏、音视频流媒体和DNS查询。

然而,正是UDP的这些“缺点”,在特定场景下却蕴含着巨大的潜力:

  • 无连接性: 没有繁琐的握手过程,可以直接发送数据,减少了延迟。
  • 轻量级: 协议开销小,传输效率高。
  • 灵活性: 由于UDP不负责可靠性,上层应用可以根据自身需求,在UDP之上构建定制化的可靠性机制,从而实现更精细的控制。

这种灵活性,正是QUIC协议能够大展拳脚的舞台。QUIC没有试图“修复”TCP,而是选择在UDP之上,重新构建一套完整的、面向流的、可靠且安全的传输协议。它充分利用了UDP的轻量和无连接特性,同时又在应用层实现了TCP所提供的所有可靠性、拥塞控制和安全性功能,甚至做得更好。

QUIC协议的诞生与核心创新 #

QUIC(Quick UDP Internet Connections)协议最初由Google开发,旨在解决TCP和TLS在HTTP/2中存在的性能瓶颈。经过多年的实践和标准化,它已成为IETF(互联网工程任务组)的正式标准,并作为HTTP/3的基础传输协议。

QUIC的核心创新点在于:

  1. 0-RTT/1-RTT连接建立: QUIC将TCP的连接建立和TLS的握手过程融合在一起。对于首次连接,它只需要一个RTT即可完成加密和传输层的握手,比TLS 1.3 over TCP快了一个RTT。更令人兴奋的是,对于后续连接,如果客户端之前与服务器建立过QUIC连接,并且服务器的加密配置没有改变,客户端甚至可以在发送第一个数据包时就携带应用数据,实现0-RTT(零往返时间)连接恢复。这就像你第一次去酒店需要办理入住手续,但之后你有了房卡,下次直接刷卡进门一样便捷。这种极致的低延迟,对于提升“高并发商业站点”的加载速度至关重要。

  2. 多路复用无队头阻塞(Multiplexing without Head-of-Line Blocking): QUIC在单个UDP连接上实现了多路复用,但与HTTP/2 over TCP不同的是,QUIC的流是独立的。如果一个流的数据包丢失,只会影响该流的传输,而不会阻塞同一连接上的其他流。这就像多条独立的快递通道,即使其中一条通道因为某个包裹丢失而暂停,其他通道上的包裹仍然可以继续派送,互不影响。这彻底解决了TCP的队头阻塞问题,在丢包率较高的网络环境下,能显著提升性能。

  3. 连接迁移(Connection Migration): QUIC连接的标识符是一个Connection ID,而不是传统的IP地址和端口号四元组。这意味着,当客户端的IP地址或端口发生变化时(例如,从Wi-Fi切换到蜂窝网络),QUIC连接可以无缝地迁移,而无需重新建立连接。这对于移动用户来说,是极大的福音,能够提供更流畅、不中断的网络体验。同时,这也使得“ISP劫持”等基于IP/端口的传统劫持手段更难奏效。

    ...