过滤爬虫垃圾邮件

Collection of structured data for analysis and processing.
Post Reply
rakibhasan
Posts: 152
Joined: Tue Dec 24, 2024 5:00 am

过滤爬虫垃圾邮件

Post by rakibhasan »

大多数情况下,他们会显示其 URL,但有时他们可能会使用已知网站的名称来欺骗您。如果您看到不认识的 URL,请想一想,“我能管理它吗​​?”如果答案是否定的,那么它就不是您的主机名。

它通常来自垃圾邮件。极少数情况下,它与跟踪代码问题有关。

以下是我的主机名报告示例。当然,从未过滤的视图来看,主视图非常干净。

现在有了好的主机名 司法部数据库 列表,就可以创建一个正则表达式了。如果您只有域名,那么这就是您的表达式;如果您有更多域名,请创建一个包含所有域名的表达式,就像我们在水果沙拉示例中所做的那样:

主机名 REGEX(示例)

重要提示!您不能创建多个“包含主机名过滤器”;如果这样做,您将排除所有数据。因此请尝试将所有主机名放入一个表达式中(您有 255 个字符)。

“有效主机名过滤器”配置:

过滤器名称:包含有效的主机名
过滤器类型:自定义 > 包含
过滤字段:主机名
过滤模式:[您创建的主机名 REGEX]
活动来源过滤器(爬虫垃圾邮件、内部来源)
阻止以下流量:

爬虫垃圾邮件
内部第三方工具(Trello、Asana、Pingdom)
重要提示:即使这些点击显示为引荐,您在过滤器中应该使用的字段是“活动来源” - “引荐”字段不起作用。
Post Reply