Noindex là gì? Các phương pháp dùng thẻ Noindex

Thẻ Noindex là gì?

Thẻ noindex là một lệnh trên trang hướng dẫn các công cụ tìm kiếm không lập chỉ mục trang. Đây là một trong những phương pháp chặn lập chỉ mục trên một trang web.

Ở đây Thẻ noindex đề cập đến thẻ meta được đặt trong phần. Tuy nhiên, cũng có thể thực hiện “noindexing” bằng cách sử dụng tiêu đề phản hồi HTTP thông qua X-Robots-Tag.

Đây là một ví dụ về phương pháp phổ biến nhất, tức là vị trí của thẻ meta “noindex” trong phần đầu của trang web:

vd thẻ nonindex
Và đây là một ví dụ về việc sử dụng X-Robots-Tag trong tiêu đề HTTP:

HTTP/1.1 200 OK
(…)

X-Robots-Tag: noindex

(…)

X-Robots_Tag có thể được sử dụng cho các tài nguyên không phải HTML như PDF, video và hình ảnh.

Tại sao thẻ “noindex” lại quan trọng?

Việc sử dụng thẻ “noindex” sẽ ngăn các trang và tài nguyên xuất hiện trong kết quả tìm kiếm một cách hiệu quả.

Chúng có thể bao gồm các trang “cảm ơn”, trang đích của quảng cáo, trang mỏng hoặc chất lượng thấp, lưu trữ blog, trang tác giả và thẻ, trang đăng nhập, v.v.

Tuy nhiên, nếu bị lạm dụng, thẻ “noindex” có thể gây hại cho trang web của bạn.

Các phương pháp hay nhất để sử dụng “noindex”

Nếu bạn đã quyết định rằng bạn cần phải “noindex” một số trang, đây là một số phương pháp hay nhất.

1. Đảm bảo trang không bị cấm trong tệp robots.txt

Các trang không được phép trong robots.txt vẫn có thể vào chỉ mục của công cụ tìm kiếm. Đôi khi các trang có thể được lập chỉ mục mà không cần thu thập dữ liệu nội dung của chúng.

Và khi bạn thêm thẻ “noindex” vào một trang, Google phải thu thập lại trang để đọc chỉ thị này. Vì vậy, bạn phải đảm bảo rằng trình thu thập thông tin có thể truy cập trang đó.

2. “noindex” trong thời gian dài dẫn đến “nofollow”

Bạn nên lưu ý rằng các trang có thẻ “noindex” về lâu dài sẽ không chuyển bất kỳ giá trị liên kết nào sang các trang khác.

John Mueller từ Google giải thích rằng khi Google thấy “noindex” trong một thời gian dài, các trang sẽ bị xóa hoàn toàn khỏi chỉ mục và các liên kết trên chúng sẽ không được thu thập thông tin nữa.

Vì vậy, ngay cả khi trang là “noindex, follow”, nó sẽ không khác với “noindex, nofollow” về lâu dài đối với Google.

Tuy nhiên, “dài hạn” ở đây có nghĩa là gì thì không rõ ràng và điều đó phụ thuộc vào nhiều yếu tố.

3. Không sử dụng “noindex” trên nội dung trùng lặp

Sử dụng thẻ “noindex” không phải là cách tốt nhất để xử lý nội dung trùng lặp(duplicate content) trên trang web của bạn.

Để hợp nhất các trang trùng lặp trên trang web của bạn, hãy sử dụng các thẻ canonical. Chuẩn hóa đúng hướng dẫn các công cụ tìm kiếm chỉ lập chỉ mục phiên bản chính (chuẩn) của trang. Tuy nhiên, các tín hiệu liên kết từ tất cả các phiên bản không chính tắc của một trang sẽ được hợp nhất, do đó sẽ thúc đẩy phiên bản chính tắc.

4.6/5 - (5 bình chọn)
Chat Facebook