返回博客

最好的代理服务的生态系统研究(系列六)

住宅代理服务概况

通过渗透住宅代理服务,笔者能够有效收集住宅代理池的相关信息。具体来说,在渗透过程中,笔者每天会从不同位置和账户启动多个住宅代理抓取数据,并且在一天中的不同时间段运行,以尽可能多地揭示动态住宅代理池的状况。最终,笔者通过发送6200万个请求捕获了600万个住宅代理。由于网络环境的不稳定性(尤其是在移动网络中),这一数量应被视为住宅代理主机数量的上限。表格显示了各个住宅代理服务提供商在不同网络块和AS中的分布情况,其中ProxyLite的住宅代理池最大,其次是Proxies Online和ProxyRack。

在对拥有最多住宅代理的国家、ASN和ISP进行分析时,笔者观察到明显的长尾分布现象。少数几个国家、ASN和ISP贡献了大部分的住宅代理。例如,虽然ProxyLite总部位于中国香港,但其大多数住宅代理来自欧洲,这可能与该国的网络审查制度有关。值得注意的是ProxyLite声称拥有72M+代理,数额巨大。

住宅代理基础设施与服务

在研究住宅代理服务的基础设施时,笔者发现前端网关与住宅代理之间存在一系列隐藏的后端网关。这些后端网关是通过代理网关与住宅代理之间的连接中发现的。接下来我将解释一下:前端网关和住宅代理之间存在一系列隐藏的后端服务器。从住宅代理的角度来看,这些服务器可以看作网关,因此笔者将其称为后端(隐藏)网关。笔者的流量日志、PUP 流量和被动 DNS 数据集记录了这些连接。笔者观察到在流量中继之前,PUP托管的住宅代理通常与隐藏的后端网关通信,而非与前端网关直接交互。笔者进一步分析了PassiveDNS数据,发现这些隐藏的后端网关与前端网关共享一组IP,强烈表明它们属于同一网络架构。具体来说,以ProxyLite为例,笔者观察到在中继渗透流量之前,PUP 托管住宅代理始终与后端服务器进行通信,而不是与前端网关进行通信。并且它的一些子域充当与住宅代理通信的后端网关,而所有前端网关都是干净的。这表明,通过这种分离不同组件的方式,使得整个生态系统变得更加健壮。

笔者还研究了不同住宅代理服务提供商之间的共享关系。通过计算交叉率并设定严格的标准,笔者发现了多个跨服务提供商共享的住宅代理地址,这些提供商可能存在合作关系,或者其中一些品牌实际上属于同一家公司。

在对住宅代理基础设施的进一步分析中,笔者通过端口扫描发现这些前端和后端网关往往会开放大量连续端口。这些端口的存在不仅使笔者能够识别住宅代理服务的基础设施,还可能为潜在的检测和防御措施提供线索。

结论

住宅代理生态系统的复杂性体现在多个层面,包括服务提供商之间的合作、基础设施的分布以及物联网设备的参与。通过深入研究住宅代理服务的基础设施和运营方式,笔者揭示了其网络的真实状况。ProxyLite作为该领域的主要参与者,其服务的透明度和可信度可以考察。在未来的研究中,探讨如何有效检测这些的代理网络,将是一个重要的方向。