Lý Huỳnh Oanh

Thứ Tư, 11 tháng 9, 2019

Thẻ canonical là gì? Một thẻ canonical sẽ giúp gì cho SEO

Thẻ canonical là một đoạn mã HTML xác định phiên bản chính cho các trang trùng lặp, gần trùng lặp và tương tự. Nói cách khác, nếu bạn có cùng một nội dung hoặc tương tự có sẵn trong các URL khác nhau, bạn có thể sử dụng các thẻ chính tắc để chỉ định phiên bản nào là phiên bản chính và do đó, nên được lập chỉ mục.

Một thẻ canonical trông như thế nào?

Thẻ canonical bổ trợ cho SEO rất nhiều

Thẻ Canonical sử dụng cú pháp đơn giản và nhất quán và được đặt trong phần <head> của trang web:

<link rel = "canonical" href = "https://example.com/sample-page/" />

Ở đây, ý nghĩa của từng phần của mã đó trong tiếng Anh:

link rel = Viking canonical Bình: Liên kết trong thẻ này là phiên bản chính (chính tắc) của trang này.
href =, https://example.com/sample-page/ Khăn: Có thể tìm thấy phiên bản chính tắc tại URL này.

Tại sao các thẻ chuẩn cho SEO?
Google không thích nội dung trùng lặp. Nó làm cho họ khó khăn hơn để lựa chọn:

Phiên bản nào của một trang để lập chỉ mục (họ sẽ chỉ lập chỉ mục một!)
Phiên bản nào của trang để xếp hạng cho các truy vấn có liên quan.
Cho dù họ nên hợp nhất các liên kết công bằng trên nền tảng trên một trang hoặc chia nó thành nhiều phiên bản.
Quá nhiều nội dung trùng lặp cũng có thể ảnh hưởng đến ngân sách thu thập dữ liệu của bạn. Điều đó có nghĩa là Google có thể sẽ lãng phí thời gian để thu thập dữ liệu nhiều phiên bản của cùng một trang thay vì khám phá nội dung quan trọng khác trên trang web của bạn.

SỰ THẬT VỀ NGÂN SÁCH CRAWL

Tất nhiên, việc buộc Google phải lãng phí thời gian để thu thập nội dung trùng lặp là điều cần tránh nếu có thể. Tuy nhiên, Google tuyên bố rằng đó không phải là vấn đề đối với hầu hết các trang web.

Nếu các trang mới có xu hướng được thu thập thông tin vào cùng ngày chúng xuất bản, thì ngân sách thu thập dữ liệu không phải là thứ mà các nhà quản trị web cần tập trung vào. Tương tự, nếu một trang web có ít hơn vài nghìn URL, phần lớn thời gian nó sẽ được thu thập hiệu quả.
Thẻ Canonical giải quyết tất cả những vấn đề này. Họ cho phép bạn cho Google biết phiên bản nào của trang mà họ nên lập chỉ mục và xếp hạng và nơi hợp nhất bất kỳ vốn chủ sở hữu liên kết nào.

Không chỉ định URL chuẩn và Google sẽ đưa vấn đề vào tay họ.

Nếu bạn không chỉ ra một URL chuẩn, chúng tôi sẽ xác định những gì chúng tôi nghĩ là phiên bản hoặc URL tốt nhất.
Dựa vào Google như thế này là một ý tưởng tuyệt vời. Họ có thể chọn một phiên bản trang của bạn mà bạn không thực sự muốn hợp quy.

LƯU Ý QUAN TRỌNG

Google tuyên bố rằng họ thường tôn trọng URL chuẩn mà bạn đặt, nhưng không phải lúc nào cũng vậy.

Lưu ý rằng ngay cả khi bạn chỉ định rõ ràng một trang chính tắc, Google có thể chọn một quy tắc khác vì nhiều lý do, chẳng hạn như hiệu suất hoặc nội dung.
Sử dụng các thẻ thực hành tốt nhất sẽ giúp giảm thiểu rủi ro Google thấy phiên bản không mong muốn của trang là chính tắc.

Nhưng tôi không có nội dung trùng lặp, phải không?
Cho rằng bạn có thể thiên đường đã xuất bản cùng một bài đăng và các trang nhiều lần, thật dễ dàng để giả định rằng trang web của bạn không có nội dung trùng lặp.

Nhưng công cụ tìm kiếm thu thập dữ liệu URL, không phải trang web.

Điều đó có nghĩa là họ xem example.com/product và example.com/product?color=red là các trang duy nhất, mặc dù họ có cùng trang web với nội dung giống hệt hoặc tương tự.

Chúng được gọi là các URL được tham số hóa và chúng là một nguyên nhân phổ biến của nội dung trùng lặp, đặc biệt là trên các trang web thương mại điện tử có điều hướng được lọc / lọc.

Ví dụ, Brown Bag Quần áo bán áo sơ mi. Đây là URL cho trang danh mục chính của họ:

https://www.bbcloth.co.uk/en-gb/cloth/shirts.html

Nếu bạn chỉ lọc các áo XL, một tham số sẽ được thêm vào URL:

https://www.bbcloth.co.uk/en-gb/cloth/shirts.html?Size=XL

Nếu sau đó bạn cũng chỉ lọc cho áo sơ mi màu xanh, một thông số khác được thêm vào:

https://www.bbcloth.co.uk/en-gb/cloth/shirts.html?Size=XL&color=Blue

Đây là tất cả các trang riêng biệt trong mắt Google, mặc dù nội dung chỉ khác nhau một chút.

Nhưng nó không chỉ là các trang web thương mại điện tử trở thành nạn nhân của nội dung trùng lặp.

Dưới đây là một số nguyên nhân phổ biến khác của nội dung trùng lặp áp dụng cho tất cả các loại trang web:

Có các URL được tham số hóa cho các tham số tìm kiếm (ví dụ: example.com?q=search-term)
Có URL được tham số hóa cho ID phiên (ví dụ: https://example.com?sessionid=3)
Có các phiên bản trang in riêng biệt (ví dụ: example.com/page và example.com/print/page)
Có URL duy nhất cho các bài đăng trong các danh mục khác nhau (ví dụ: example.com/service/SEO/ và example.com/specials/SEO/)

Có trang cho các loại thiết bị khác nhau (ví dụ: example.com và m.example.com)
Có các phiên bản AMP và không phải AMP của một trang (ví dụ: example.com/page và amp.example / page)
Phục vụ cùng một nội dung ở các biến thể không phải www / www và không https / https (ví dụ: https://example.com và http://www.example.com)
Trong những tình huống này, việc sử dụng đúng thẻ kinh điển là rất quan trọng.

Hơn nữa, các vấn đề nội dung trùng lặp tên miền chéo cũng là một điều. Nếu bạn cung cấp nội dung (ví dụ: nếu một tờ báo muốn đăng lại nguyên văn nội dung của bạn trên trang web của họ) thì bạn nên yêu cầu họ đặt một liên kết chính tắc với bản gốc. Bạn có thể xem thêm <<<tại đây>>>

Không có nhận xét nào:

Đăng nhận xét