Trùng lặp nội dung trong SEO và những điều cần biết.
Hiện nay các bộ máy tìm kiếm và đặc biệt là Google xem xét
rất kỹ việc trùng lặp nội dung hay còn gọi là duplicate content. Việc trùng lặp
nội dung giữa các website thường mang đến nhiều phiền toái cho tác giả, người
trích lại hoặc ngay cả cho người tham quan website. Việc bạn để duplicate
content xảy ra chắc chắn sẽ ảnh hưởng xấu tới thứ hạng các từ khóa của bạn.
Tuy nhiên, có một số bạn chưa hiểu được duplicate content là
gì? Hãy cùng Ancoti tìm hiểu về vấn đề này. Duplicate content (Trùng lặp nội
dung), là sự trùng lặp nội dung trên một website hay nhiều website. Các SE (search engine) muốn hiển thị nội dung đa dạng và phong phú, để người dùng có
nhiều sự lựa chọn khác nhau. Vì vậy các SE chỉ hiển thị một nội dung duy nhất
trong kết quả tìm kiếm. Còn nếu bạn muốn hiểu rõ thêm SEO là gì thì tìm hiểu thêm nhé.
Nội dung bị trùng lặp bởi các URL cùng thuộc tên miền của
trang. Ví dụ phía trên là một dạng duplicate trong trang. Ngoài ra duplicate
trong trang còn một số dạng duplicate như sau:
1.1 Session ID:
Ví dụ:
http://example.com/web?ID=123
http://example.com/web
http://example.com/web
Cả 2 cùng trỏ về một nội dung trên website.
1.2 Tham số thuộc tính trên URL
Ví dụ :
http://example.com/web?color=red
http://example.com/web-red
http://example.com/web-red
Cả 2 cùng trỏ về nội dung web màu đỏ trên website.
1.3 Thư mục trên URL
Ví dụ :
http://example.com/web/design
http://example.com/design
http://example.com/design
Cả 2 cùng trỏ về cùng một nội dung trên website mặc dù đường
dẫn thư mục khác nhau.
1.5 Các tag trên URL
Ví dụ :
http://example.com/tag/web-design
http://example.com/web
http://example.com/web
Các 2 cùng trỏ về cùng một nội dung. Chức năng tag này
thường được rất nhiều người sử dụng, nhưng nếu không để ý chuyển đổi sang một
URL duy nhất thì lỗi duplicate sẽ xuất hiện.
2. Duplicate ngoài trang:
Duplicate ngoài trang có 2 trường hợp đáng chú ý. Trường hợp
duplicate do trích dẫn lại hoặc duplicate do cố ý spam.
2.1 Duplicate do trích dẫn:
Dễ thấy nhất là các trang báo, tin tức hoặc các nội dung hay
thường được các trang khác trích dẫn lại. Điều này là tốt nhưng đôi khi cũng
gây ra nhiều sự phiền toái. Các search engine không nhận được đâu là bài gốc,
thường thì search engine dựa vào độ trust của trang hoặc thời điểm index để xác
định nội dung gốc.
Nhưng cũng sẽ xảy ra trường hợp trang có độ trust cao trích
dẫn lại trang có độ trust thấp, làm cho trang chủ nội dung gặp nhiều thiệt thòi
trong lỗi duplicate.
2.2 Duplicate do cố ý spam:
Một số đối thủ sử dụng thủ thuật làm mờ mắt search engine
khi nhân bản ra hàng loạt nội dung giống nhau trên cả trang có độ trust cao
cũng như trang có độ trust thấp.
Bạn cũng biết rằng không phải lúc nào nội dung trên web của
bạn cũng được index trước, đôi khi Google vẫn lầm tưởng nội dung mà bạn viết ra
chính là duplicate content với các nội dung mà đối thủ mang đi spam.
Vậy để tránh duplicate content bạn cần phải làm gì?
Việc khắc phục lỗi này cũng không phải là khó khăn, nhưng
bạn phải làm triệt để và kiên trì. Bạn không nên spam các bài viết cùng một nội
dung lên các website khác, không nên copy y nguyên nội dung của trang khác về
trang của mình. Một vấn đề nữa cũng khá quan trọng, bạn nên khắc phục lỗi 301
để website của bạn chỉ ở dạng www hoặc non www.







0 comments:
Post a Comment