Cách ngăn các bot spam phá hỏng dữ liệu giới thiệu phân tích của bạn [Gammatraffic] - Moz (2023)

Quan điểm của tác giả hoàn toàn là của riêng họ (không bao gồm trường hợp thôi miên khó xảy ra) và có thể không phải lúc nào cũng phản ánh quan điểm của Moz.

Một vài tháng trở lại đây, đại lý của tôi bắt đầu thấy lưu lượng truy cập giới thiệu tăng đột biến trong tài khoản Google Analytics của chúng tôi. Lúc đầu, tôi rất hào hứng. Ai đó đang liên kết với chúng tôi và mọi người đang nhấp vào. Hoan hô!

Sai! Làm thế nào rất, rất sai. Khi tìm hiểu sâu hơn, tôi thấy rằng hầu hết lưu lượng truy cập giới thiệu này được gửi từ những người gửi thư rác và chủ yếu là từ một người gửi thư rác tên là Vitaly Popov (hoặc, như tôi muốn gọi anh ấy là “vết đau gần đây nhất ở mông tôi”).

Các miền mà anh ấy sở hữu đã mang lại cho trang web của công ty chúng tôi và hầu hết các trang web của khách hàng của chúng tôi vài trăm phiên mỗi tháng, đủ để loại bỏ dữ liệu phân tích trong nhiều trường hợp.

Các trang web của anh ấy không phải là những trang web duy nhất mà tôi sẽ trình bày trong phần hướng dẫn này, nhưng mạng thư rác của anh ấy gần đây gây phiền toái lớn nhất. Nếu bạn nhận được liên kết giới thiệu spam trong phân tích của mình, thì bạn cũng có thể thực hiện theo các bước tương tự để ngăn các phần mềm làm sai lệch dữ liệu này làm hỏng dữ liệu của bạn.

Tại sao tôi cần phải lo lắng về việc chặn và lọc các trang web này?

Có hai lý do chính khiến tôi bị thôi thúc chặn những thứ này trên tất cả các trang web mà tôi làm việc cùng. Đầu tiên: dữ liệu phân tích bị hỏng. Vài trăm lượt truy cập mỗi tháng trên một trang web nhưMoz.comsẽ không di chuyển kim khi so sánh với khối lượng phiên tuyệt đối mà họ có hàng ngày. Tuy nhiên, trên một trang web nhỏ dành cho thợ sửa ống nước địa phương, 30 phiên mỗi ngày có khả năng là 70% lưu lượng truy cập giới thiệu spam, bóp nghẹt lưu lượng truy cập hợp pháp còn lại và khiến việc phân tích tiếp thị trở thành một nỗ lực khó chịu.

Thứ hai: tải và bảo mật máy chủ. Tôi không yêu cầu họ thu thập thông tin hoặc truy cập trang web của tôi. Lượt truy cập của họ đang sử dụng tài nguyên máy chủ của tôi cho thứ mà tôi không muốn hoặc không cần. Máy chủ quá tải có nghĩa là thời gian tải chậm hơn, dẫn đến tỷ lệ thoát cao hơn và thứ hạng thấp hơn. Ngoài ra, ai biết được họ đang làm gì khác trên trang web của tôi khi họ ở đó. Họ có thể dễ dàng tìm kiếm các lỗ hổng WordPress, plugin và máy chủ.

Các miền spam giới thiệu phổ biến

sử dụngWHOIS.net, tôi thấy rằng mạng thư rác của ông Popov bao gồm các miền sau:

  • darodar.com(và các tên miền phụ khác nhau)
  • econom.co
  • ilovevitaly.co(và các biến thể TLD khác)

Những kẻ gửi thư rác khác đang gây khó chịu cho web bao gồm:

  • semalt.com(và các tên miền phụ khác nhau)
  • nút-cho-website.com
  • xem-trang-web-của-bạn-tại-đây.com

Nhiều trang web khác đã đến và đi. Đây chỉ là những trang web đã hoạt động gần đây.

Tại sao họ đánh trang web của tôi?

Tại sao mọi người lại nỗ lực rất nhiều để thu thập thông tin trên web mà không tự chặn mình khỏi các phân tích? Thư rác! Rất nhiều thư rác, nó vẫn thổi bay tôi. Tôi đã xem xét một số trang web được liệt kê ở trên. Ba trong số những người sung mãn nhất đang làm điều đó vì những lý do rất khác nhau.

Xem-trang-web-của-bạn-tại-đây.com

Cách ngăn các bot spam phá hỏng dữ liệu giới thiệu phân tích của bạn [Gammatraffic] - Moz (1)

Trang web này lấy bánh làm khó chịu nhất. Trang web này đang sử dụng thư rác liên kết giới thiệu như một hình thức tạo khách hàng tiềm năng. Bạn hỏi sản phẩm của họ là gì? Thư rác trên web. Bạn có thể trả tiền cho see-your-website-here.com để thực hiện spam web cho công ty của mình như một hình thức tạo khách hàng tiềm năng. Chủ sở hữu của miền này đã đủ tử tế để công khai thông tin WHOIS của mình. Tên anh ấy là Ben Sykes và anh ấy đến từ London.

Semalt.com

Cách ngăn các bot spam phá hỏng dữ liệu giới thiệu phân tích của bạn [Gammatraffic] - Moz (2)

Semalt.com và tôi đã có một mối quan hệ tốt đẹp nhất. Semalt là một sản phẩm SEO được thiết kế để phân tích trên trang và ngoài trang, chẳng hạn như việc sử dụng từ khóa và số liệu liên kết. Sản phẩm của họ dường như là một phần hợp pháp. Tuy nhiên, thực tiễn kinh doanh của họ thì không. Semalt sử dụng bot để thu thập dữ liệu trên web và lập chỉ mục dữ liệu trang web, nhưng chúng không tắt tính năng theo dõi phân tích như hầu hết các bot đáng kính đều làm. Họ có một biểu mẫu để xóa trang web của bạn khỏi bị thu thập thông tin tạihttp://semalt.com/project_crawler.php, đó là bao giờ rất tốt đẹp của họ. Tất nhiên, tôi đã thử cách này vài tháng trước và họ vẫn thu thập dữ liệu trang web của chúng tôi. Cuối cùng tôi đã nói chuyện với một đại diện từ Semalt.com qua Twitter sau khi tôi viết bài báo này:Cách ngăn Semalt.com làm hỏng dữ liệu Google Analytics của bạn. Tôi đã ghi lại các tương tác của chúng tôi và kết quả của dự án đó trong bài báo.

Darodar.com, econom.co và ilovevitaly.com

Cách ngăn các bot spam phá hỏng dữ liệu giới thiệu phân tích của bạn [Gammatraffic] - Moz (3)

Mạng này dường như tồn tại với mục đích hướng lưu lượng truy cập liên kết đến các trang web mua sắm như AliExpress.com và eBay.com. Tôi đoán rằng trang web sẽ không thanh toán cho đơn vị liên kết trừ khi lưu lượng truy cập dẫn đến việc mua hàng, điều này có vẻ khó xảy ra. Miền phụ shopping.ilovevitaly.com được sử dụng để chuyển hướng trực tiếp đến aliexpress.com, nhưng giờ đây nó chuyển đến một trang đích liên kết đến nhiều nhà bán lẻ trực tuyến.

Làm thế nào để ngăn chặn chương trình thư rác

Chặn qua .htaccess

Cách tốt nhất để chặn những người giới thiệu truy cập vào trang web của bạn là chặn họ trong tệp .htaccess của bạn trong thư mục gốc của tên miền của bạn. Bạn có thể sao chép và dán đoạn mã sau vào tệp .htaccess của mình, giả sử bạn đang sử dụng máy chủ Apache. Tôi thích phương pháp này hơn là chỉ chặn miền trong phân tích vì nó ngăn hoàn toàn các chương trình thư rác tấn công máy chủ của bạn. Nếu bạn muốn sáng tạo, bạn có thể chuyển hướng lưu lượng truy cập trở lại trang web của họ.

# Chặn người Nga giới thiệu SpamRewriteEngine onRewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly\.com/ [NC,OR]RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly.\.ru/ [NC,OR] RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly\.org/ [NC,OR]RewriteCond %{HTTP_REFERER} ^http://.*ilovevitaly\.info/ [NC,OR]RewriteCond %{HTTP_REFERER} ^ http://.*iloveitaly\.ru/ [NC,OR]RewriteCond %{HTTP_REFERER} ^http://.*econom\.co/ [NC,OR]RewriteCond %{HTTP_REFERER} ^http://.* savetubevideo\.com/ [NC,OR]RewriteCond %{HTTP_REFERER} ^http://.*kambasoft\.com/ [NC,OR]RewriteCond %{HTTP_REFERER} ^http://.*buttons\-for\- trang web\.com/ [NC,OR]RewriteCond %{HTTP_REFERER} ^http://.*semalt\.com/ [NC,OR]RewriteCond %{HTTP_REFERER} ^http://.*darodar\.com/ [ NC]RewriteRule ^(.*)$ – [F,L]

Cảnh báo:.htaccess là một tệp rất mạnh cho phép máy chủ của bạn hoạt động như thế nào. Nếu bạn tải lên tệp .htaccess có một ký tự không đúng chỗ, bạn có thể sẽ gỡ toàn bộ trang web xuống. Trước khi bạn thực hiện bất kỳ thay đổi nào đối với tệp, tôi khuyên bạn nên tạo một bản sao lưu. Nếu bạn không cảm thấy thoải mái khi thực hiện những chỉnh sửa này, hãy xem tùy chọn plugin WordPress bên dưới.

bộ lọc phân tích

Bản thân .htaccess sẽ không giải quyết được tất cả các vấn đề của bạn. Nó sẽ chỉ bảo vệ bạn khỏi các phiên trong tương lai và sẽ không ảnh hưởng đến các phiên đã xảy ra. Tôi muốn thiết lập bộ lọc theo quốc gia trong phân tích để xóa dữ liệu lịch sử cũng như giúp lọc ra bất kỳ bot nào khác mà chúng tôi có thể tìm thấy từ các quốc gia được chọn trong tương lai. Tất nhiên đây không phải là một ý tưởng hay nếu bạn muốn nhận được lưu lượng truy cập hợp pháp từ các quốc gia như Nga, Brazil hoặc Indonesia, nhưng nhiều công ty có trụ sở tại Hoa Kỳ có thể chặn các quốc gia này một cách an toàn mà không làm mất khách hàng tiềm năng. Thực hiện theo các bước bên dưới để thiết lập các bộ lọc.

Đầu tiên, nhấp vào tab "Quản trị" ở đầu trang. Trên cột chế độ xem, bạn sẽ muốn tạo chế độ xem "mới" để bạn vẫn có báo cáo hoàn chỉnh về tất cả lưu lượng truy cập trong Google Analytics. Tôi đặt tên cho cái của mình là "Filter Bots." Sau khi bạn đã chọn chế độ xem mới, hãy nhấp vào phần "Bộ lọc" rồi chọn "+Nút bộ lọc mới".

Cách ngăn các bot spam phá hỏng dữ liệu giới thiệu phân tích của bạn [Gammatraffic] - Moz (4)

Việc thiết lập bộ lọc khá đơn giản nếu bạn biết nên sử dụng cài đặt nào. Tôi muốn lọc ra tất cả lưu lượng truy cập từ Nga, Brazil và Indonesia. Đây chỉ là những quốc gia đã gây ra cho chúng tôi những vấn đề gần đây. Bạn có thể thêm nhiều bộ lọc hơn khi cần.

Tên bộ lọc chỉ là một nhãn tùy ý. Tôi thường chỉ gõ “chặn [chèn quốc gia vào đây]”. Tiếp theo, chọn loại bộ lọc “tùy chỉnh”. Chọn “quốc gia” từ menu thả xuống “Filter Field”. “Filter Pattern Field” là nơi bạn thực sự xác định quốc gia nào bạn đang lọc, vì vậy hãy đảm bảo bạn viết đúng chính tả các quốc gia đó. Bạn có thể kiểm tra kỹ các bộ lọc của mình bằng cách sử dụng nút “Xác minh bộ lọc này”. Một biểu đồ sẽ bật lên và cho bạn biết có bao nhiêu phiên sẽ bị xóa khỏi bảy ngày qua.

Cách ngăn các bot spam phá hỏng dữ liệu giới thiệu phân tích của bạn [Gammatraffic] - Moz (5)

Tôi khuyên bạn nên chọn hộp kiểm “Lọc Bot” được tìm thấy trong “Cài đặt Chế độ xem” trong tab “Quản trị”. Tôi chưa thấy dữ liệu của mình thay đổi khi sử dụng tính năng này, nhưng thiết lập nó không hại gì vì nó thực sự dễ dàng và có thể Google sẽ quyết định chặn một số người gửi thư rác này.

Cách ngăn các bot spam phá hỏng dữ liệu giới thiệu phân tích của bạn [Gammatraffic] - Moz (6)

Sử dụng WordPress? Bạn không muốn chỉnh sửa tệp .htaccess của mình?

Tôi đã sử dụng pluginWp-Bantrước đây và nó giúp dễ dàng chặn những khách truy cập không mong muốn. Wp-ban cung cấp cho bạn khả năng cấm người dùng theo IP, dải IP, tên máy chủ, tác nhân người dùng và URL liên kết giới thiệu truy cập blog WordPress của bạn, tất cả từ trong bảng quản trị WordPress. Đây là một lựa chọn tuyệt vời cho những người không muốn chỉnh sửa tệp .htaccess của họ hoặc không cảm thấy thoải mái khi làm như vậy.

tài nguyên bổ sung

Có một số bài đăng tuyệt vời khác mà bạn có thể tham khảo nếu đang tìm kiếm thêm thông tin về cách xử lý thư rác liên kết giới thiệu:

  1. http://www.optimizesmart.com/geek-guide-removing-referrer-spam-google-analytics/
  2. https://megalytic.com/blog/how-to-filter-out-fake-referrals-and-other-google-analytics-spam
  3. http://blog.raventools.com/stop-referrer-spam/
  4. http://www.analyticsedge.com/2014/12/removing-referral-spam-google-analytics/

Phần kết luận

Tôi hy vọng điều này sẽ giúp bạn chặn tất cả những kẻ gửi thư rác phiền phức ngoài kia. Chắc chắn có nhiều cách khác nhau để bạn có thể giải quyết vấn đề này và đây chỉ là những cách đã giúp tôi bảo vệ dữ liệu phân tích. Tôi rất muốn biết cách bạn xử lý spambot. Chia sẻ câu chuyện của bạn với meon Twitter hoặc trong phần bình luận bên dưới.

References

Top Articles
Latest Posts
Article information

Author: Virgilio Hermann JD

Last Updated: 08/12/2023

Views: 6187

Rating: 4 / 5 (41 voted)

Reviews: 80% of readers found this page helpful

Author information

Name: Virgilio Hermann JD

Birthday: 1997-12-21

Address: 6946 Schoen Cove, Sipesshire, MO 55944

Phone: +3763365785260

Job: Accounting Engineer

Hobby: Web surfing, Rafting, Dowsing, Stand-up comedy, Ghost hunting, Swimming, Amateur radio

Introduction: My name is Virgilio Hermann JD, I am a fine, gifted, beautiful, encouraging, kind, talented, zealous person who loves writing and wants to share my knowledge and understanding with you.