Duplicate content là gì và cách khắc phục nội dung trùng lặp trong website

Duplicate content (nội dung trùng lặp) là một trong những nguyên nhân khiến các trang trong một số các trang trùng lặp không thể nào lên top được. Google cho biết họ có thể sẽ không lập chỉ mục đối với những trang có nội dung trùng lặp. Trong bài viết này mình sẽ nói rõ hơn về Duplicate content và cách để khắc phục vấn đề này cho website của bạn.

Duplicate content là gì?

Nội dung trùng lặp là hiện tượng website của bạn có chứa ít nhất hai trang trở lên có trùng lặp về thẻ tiêu đề, mô tả và nội dung.

Các trang trùng lặp nội dung sẽ không được index, điều này giúp cho Google loại bỏ được rất nhiều tài nguyên hệ thống không cần thiết khi phải lưu trữ các kết quả trung lặp. Tuy nhiên Google có thông báo về những vấn đề này trong webmaster tools để giúp quản trị viên khắc phục được sự cố.

Trong phần cải tiến HTML, google có liệt kê một số vấn đề mà website bạn phải gặp phải.

Trong phần cải tiến HTML, google có liệt kê một số vấn đề mà website bạn phải gặp phải.

Duplicate content không phải là một yếu tố góp phần vào SEO, mà nó là một yêu cầu đòi hỏi bạn phải giải quyết.

Để khắc phục vấn đề này bạn có nhiều cách như, xóa các trang trùng lặp nội dung, sử dụng 301 để chuyển hướng đến 1 trang duy nhất hoặc sử dụng thẻ rel=”canonical”.

Khắc phục nội dung trùng lặp

Sử dụng chuyển hướng 301

Khi bạn có các trang nội dung trùng lặp, bạn có thể sử dụng kỹ thuật chuyển hướng 301. Khi bot google truy cập nó cũng được chuyển hướng đến trang cuối, và tại đây nó bắt đầu thu thập nội dung ở trang đó thay vì trang cũ.

Phương pháp này cũng được sử dụng để bạn thay thế url cho một trang của một từ khóa.

Sử dụng thẻ rel=”next, prev, canonical”

Trong một trang web thường có chứa các trang danh mục, những trang này thường sử dụng cách phân chia thành nhiều trang để rút gọn hiển thị. Việc phân ra nhiều trang khiến chúng có nhiều thứ trùng lặp như tiêu đề hay mô tả. Việc sử dụng thẻ link với thuộc tính rel.

Ví dụ bạn có một trang danh mục với trang 1 có url là: https://domain/danhmuc. trang hai có url là https://domain/danhmuc/page2, trang 3 có https://domain/danhmuc/page3. Các thẻ rel lần lượt như sau:

  • Trang 1: <link rel="next" href="https://domain/danhmuc/page2" />
  • Trang 2: <link rel="prev" href="https://domain/danhmuc" /> và <link rel="next" href="https://domain/danhmuc/page3" />
  • Trang 3: <link rel="prev" href="https://domain/danhmuc/page2" />

Tất cả các trang đều nên có thêm canonical với url chính nó.

Loại bỏ các trang trùng lặp

Một giải pháp nữa là chúng ta có thể xóa bỏ các trang trùng lặp. Thay vì phân trang sử dụng URL thì bạn có thể sử dụng Ajax để thay thế tải trên một URL.

Nếu bạn sử dụng wordpress có thể sử dụng plugin SEO hoặc thêm đoạn sau vào file functions.php của theme

function rel_next_prev_pagination() {
 global $paged;
 if ( get_previous_posts_link() ) { ?>
   <link rel="prev" href="<?php echo get_pagenum_link( $paged - 1 ); ?>">
 <?php
 }
 if ( get_next_posts_link() ) { ?>
   <link rel="next" href="<?php echo get_pagenum_link( $paged + 1 ); ?>">
 <?php
 }
}
remove_action('wp_head', 'adjacent_posts_rel_link_wp_head');
add_action('wp_head', 'rel_next_prev_pagination');

XDIGI với dịch vụ content marketing mang đến giải pháp viết nội dung chuẩn SEO cho website doanh nghiệp. Nếu quan tâm bạn có thể trải nghiệm dịch vụ này của XDIGI nhé.

ĐOÀN TUẤN
Tác giả:
Với hơn 8 năm trong lĩnh vực Digital Marketing, và 10 năm là lập trình viên website. Tuấn luôn sẵn sàng chia sẻ những kiến thức và kinh nghiệm có được. Hãy theo dõi Blog này để cập nhật những thông tin mới nhất nhé. Và nếu bạn cần giúp đỡ, đừng nần ngại liên hệ với tôi qua các trang mạng xã hội dưới đây !
Đ A N G T I . . .

Đăng ký nhận tư vấn

Chúng tôi sẽ tư vấn miễn phí những vấn đề mà bạn quan tâm để phát triển doanh nghiệp. Đừng ngại liên hệ với chúng tôi.