Friday, January 4, 2013

Vấn đề cần biết về trùng lặp nội dung trong SEO

Trùng lặp nội dung trong SEO và những điều cần biết.
Hiện nay các bộ máy tìm kiếm và đặc biệt là Google xem xét rất kỹ việc trùng lặp nội dung hay còn gọi là  duplicate content. Việc trùng lặp nội dung giữa các website thường mang đến nhiều phiền toái cho tác giả, người trích lại hoặc ngay cả cho người tham quan website. Việc bạn để duplicate content xảy ra chắc chắn sẽ ảnh hưởng xấu tới thứ hạng các từ khóa của bạn.

Tuy nhiên, có một số bạn chưa hiểu được duplicate content là gì? Hãy cùng Ancoti tìm hiểu về vấn đề này. Duplicate content (Trùng lặp nội dung), là sự trùng lặp nội dung trên một website hay nhiều website. Các SE (search engine) muốn hiển thị nội dung đa dạng và phong phú, để người dùng có nhiều sự lựa chọn khác nhau. Vì vậy các SE chỉ hiển thị một nội dung duy nhất trong kết quả tìm kiếm. Còn nếu bạn muốn hiểu rõ thêm SEO là gì thì tìm hiểu thêm nhé.

duplicate_content

1. Duplicate trong trang:
Nội dung bị trùng lặp bởi các URL cùng thuộc tên miền của trang. Ví dụ phía trên là một dạng duplicate trong trang. Ngoài ra duplicate trong trang còn một số dạng duplicate như sau:
 1.1 Session ID:
Ví dụ:
http://example.com/web?ID=123
http://example.com/web
Cả 2 cùng trỏ về một nội dung trên website.

1.2 Tham số thuộc tính trên URL
Ví dụ :
http://example.com/web?color=red
http://example.com/web-red
Cả 2 cùng trỏ về nội dung web màu đỏ trên website.
1.3 Thư mục trên URL
Ví dụ : 
http://example.com/web/design
http://example.com/design
Cả 2 cùng trỏ về cùng một nội dung trên website mặc dù đường dẫn thư mục khác nhau.

1.5 Các tag trên URL

Ví dụ :
http://example.com/tag/web-design
http://example.com/web
Các 2 cùng trỏ về cùng một nội dung. Chức năng tag này thường được rất nhiều người sử dụng, nhưng nếu không để ý chuyển đổi sang một URL duy nhất thì lỗi duplicate sẽ xuất hiện.


2. Duplicate ngoài trang:
Duplicate ngoài trang có 2 trường hợp đáng chú ý. Trường hợp duplicate do trích dẫn lại hoặc duplicate do cố ý spam.

2.1 Duplicate do trích dẫn:
Dễ thấy nhất là các trang báo, tin tức hoặc các nội dung hay thường được các trang khác trích dẫn lại. Điều này là tốt nhưng đôi khi cũng gây ra nhiều sự phiền toái. Các search engine không nhận được đâu là bài gốc, thường thì search engine dựa vào độ trust của trang hoặc thời điểm index để xác định nội dung gốc.
Nhưng cũng sẽ xảy ra trường hợp trang có độ trust cao trích dẫn lại trang có độ trust thấp, làm cho trang chủ nội dung gặp nhiều thiệt thòi trong lỗi duplicate.

2.2 Duplicate do cố ý spam:
Một số đối thủ sử dụng thủ thuật làm mờ mắt search engine khi nhân bản ra hàng loạt nội dung giống nhau trên cả trang có độ trust cao cũng như trang có độ trust thấp.
Bạn cũng biết rằng không phải lúc nào nội dung trên web của bạn cũng được index trước, đôi khi Google vẫn lầm tưởng nội dung mà bạn viết ra chính là duplicate content với các nội dung mà đối thủ mang đi spam.
Vậy để tránh duplicate content bạn cần phải làm gì? 
Việc khắc phục lỗi này cũng không phải là khó khăn, nhưng bạn phải làm triệt để và kiên trì. Bạn không nên spam các bài viết cùng một nội dung lên các website khác, không nên copy y nguyên nội dung của trang khác về trang của mình. Một vấn đề nữa cũng khá quan trọng, bạn nên khắc phục lỗi 301 để website của bạn chỉ ở dạng www hoặc non www.


0 comments:

Post a Comment