Hướng dẫn tạo Sitemap: Công cụ và Thực hành

Định dạng Sitemap là gì?

Sitemap là một bản thiết kế của trang web của bạn giúp các công cụ tìm kiếm tìm ra, duyệt và chỉ mục tất cả nội dung trang web của bạn. Sitemap cũng cho biết cho các công cụ tìm kiếm biết trang nào trên trang web của bạn quan trọng nhất.

Có bốn loại sitemap chính:

  • Sitemap XML thông thường: Đây là loại sitemap phổ biến nhất. Thông thường nó được thiết kế dưới dạng một Sitemap XML liên kết đến các trang khác nhau trên trang web của bạn.
  • Sitemap Video: Được sử dụng đặc biệt để giúp Google hiểu nội dung video trên trang của bạn.
  • Sitemap Tin tức: Giúp Google tìm nội dung trên các trang web được phê duyệt cho Google Tin tức.
  • Sitemap Hình ảnh: Giúp Google tìm tất cả hình ảnh được lưu trữ trên trang web của bạn.
  • Tại sao Sitemap quan trọng?

    Các công cụ tìm kiếm như Google, Yahoo và Bing sử dụng sitemap của bạn để tìm các trang khác nhau trên trang web của bạn.

    Tại sao Sitemap quan trọng?

    Như Google nói:

    “Nếu các trang của trang web của bạn được liên kết đúng cách, trình thu thập web của chúng tôi thường có thể khám phá được hầu hết trang web của bạn.”

    Nói cách khác: có lẽ bạn không CẦN một sitemap. Nhưng nó chắc chắn sẽ không gây thiệt hại cho nỗ lực SEO của bạn. Vì vậy, việc sử dụng chúng là hợp lý.

    Cũng có một số trường hợp đặc biệt mà sitemap thực sự hữu ích.

    Ví dụ, Google chủ yếu tìm trang web thông qua liên kết. Và nếu trang web của bạn mới thành lập và chỉ có một số lượng ít liên kết ngoại vi, thì sitemap là RẤT QUAN TRỌNG để giúp Google tìm trang trên trang web của bạn.

    Hoặc có thể bạn đang vận hành một trang web thương mại điện tử với 5 triệu trang. Trừ khi bạn liên kết nội bộ HOÀN HẢO và có rất nhiều liên kết ngoại vi, Google sẽ gặp khó khăn trong việc tìm tất cả các trang đó. Đó là lúc sitemap xuất hiện.

    Với điều đó, dưới đây là cách thiết lập một sitemap … và tối ưu hóa nó cho SEO.

    Thực hành tốt nhất

    Tạo Sitemap

    Bước đầu tiên của bạn là tạo một sitemap.

    Nếu bạn sử dụng WordPress, bạn có thể tạo một sitemap với plugin Yoast SEO.

    Thực hành tốt nhất

    Lợi ích chính của việc sử dụng Yoast để tạo sitemap XML của bạn là nó được cập nhật tự động (sitemap động).

    Vì vậy, mỗi khi bạn thêm một trang mới vào trang web của bạn (dù đó là một bài đăng blog hoặc trang sản phẩm thương mại điện tử), một liên kết đến trang đó sẽ được thêm vào tệp sitemap của bạn tự động:

    Thực hành tốt nhất

    Nếu bạn không sử dụng Yoast, có rất nhiều plugin khác có sẵn cho WordPress (như Google XML Sitemaps) mà bạn có thể sử dụng để tạo sitemap:

    Tham khảo  Cách cài đặt Personal CRM với Monica trên Ubuntu 20.04

    Thực hành tốt nhất

    Nếu bạn không sử dụng WordPress?

    Không vấn đề gì. Bạn có thể sử dụng công cụ tạo sitemap của bên thứ ba như XML-Sitemaps.com. Chúng sẽ tạo ra một tệp XML mà bạn có thể sử dụng làm sitemap của bạn.

    Thực hành tốt nhất

    Dù sao đi nữa, sau khi tạo sitemap của bạn, tôi khuyên bạn nên xem xét một cách thủ công.

    Thực hành tốt nhất

    (Sitemap của bạn thường được tìm thấy tại site.com/sitemap.xml. Nhưng điều đó phụ thuộc vào hệ quản trị nội dung và chương trình bạn sử dụng để tạo sitemap của bạn)

    Nó sẽ hiển thị tất cả các trang trên trang web của bạn:

    Thực hành tốt nhất

    Nếu mọi thứ trông tốt, đến lúc làm thủ tục gửi sitemap của bạn cho Google.

    Gửi Sitemap Của Bạn Cho Google

    Để gửi sitemap của bạn, đăng nhập vào tài khoản Google Search Console của bạn.

    Sau đó, điều hướng đến “Index” → “Sitemaps” trong thanh bên.

    Thực hành tốt nhất

    Nếu bạn đã gửi sitemap của bạn, bạn sẽ thấy một danh sách “Submitted Sitemaps” trên trang này:

    Thực hành tốt nhất

    Dù sao đi nữa, để gửi sitemap của bạn, hãy nhập URL sitemap của bạn vào trường này:

    Thực hành tốt nhất

    Và nhấn “Submit”.

    what is a sitemap the unsung hero for website visibility 987116

    Và nếu mọi thứ đã được thiết lập đúng, bạn sẽ thấy thông tin về sitemap của bạn trên trang này dưới phần “Submitted Sitemaps”:

    Thực hành tốt nhất

    Sử dụng Báo cáo Sitemap để Phát hiện Lỗi

    Sau khi Google thu thập sitemap của bạn, nhấp vào nó trong phần “Submitted Sitemaps”:

    Thực hành tốt nhất

    Nếu bạn thấy “Sitemap index processed successfully”, tức là Google đã thành công thu thập sitemap của bạn.

    Thực hành tốt nhất

    Bạn cũng có thể nhấp vào biểu đồ cột nhỏ để xem Báo cáo Phạm vi cho sitemap của bạn:

    Thực hành tốt nhất

    Báo cáo này cho bạn biết có bao nhiêu URL Google tìm thấy trong sitemap của bạn … và có bao nhiêu trang đó được đưa vào chỉ mục của Google:

    Thực hành tốt nhất

    Ví dụ, bạn có thể thấy sitemap của tôi chứa liên kết đến 116 trang web. 109 trang là “hợp lệ” và 6 trang là “bị loại trừ”.

    Thực hành tốt nhất

    Tất nhiên, tôi có thể bỏ qua các trang hợp lệ.

    Nhưng tôi muốn kiểm tra các trang “bị loại trừ” để xem tình hình như thế nào.

    Có vẻ như 6 URL trong sitemap của tôi đang nhận được thông báo “Trùng lặp, URL đã được gửi không được chọn làm nguồn gốc”.

    Thực hành tốt nhất

    Và khi tôi xem các URL, tôi thấy đây là những trang mà tôi thậm chí không muốn lập chỉ mục từ đầu.

    Thực hành tốt nhất

    Vì vậy, tôi nên loại bỏ chúng khỏi sitemap của tôi.

    Sử dụng Sitemap của Bạn để Phát hiện Vấn đề với Chỉ mục hóa

    Một trong những điều thú vị khi sử dụng sitemap là nó cung cấp một ước lượng rộng lớn về:

  • Số trang bạn MUỐN được chỉ mục
  • Số trang ĐÃ được chỉ mục
  • Ví dụ, hãy nói rằng sitemap của bạn liên kết đến 5.000 trang.

    Nhưng khi bạn xem Google Search Console, trang web của bạn chỉ có 2.000 trang được chỉ mục.

    Đó là dấu hiệu cho thấy có điều gì đó không ổn. Có thể là có rất nhiều nội dung trùng lặp trong những trang đó. Vì vậy, Google không chỉ mục tất cả chúng.

    Tham khảo  Cách xây dựng một đội SEO tốt nhất: Vị trí quan trọng

    Hoặc có thể là số lượng trang trên trang web của bạn vượt quá ngân sách duyệt web của bạn.

    Ổn định Sitemap và Robots.txt

    Quan trọng là sitemap và Robots.txt của bạn hoạt động cùng nhau.

    Nói cách khác:

    Nếu bạn chặn một trang trong robots.txt hoặc sử dụng thẻ “noindex” trên một trang, bạn KHÔNG muốn nó xuất hiện trong sitemap của bạn.

    Nếu không, bạn đang gửi thông điệp lẫn lộn cho Google.

    Sitemap của bạn nói: “Trang này quan trọng đến mức được đưa vào sitemap của chúng tôi”. Nhưng khi Googlebot đến trang, họ bị chặn.

    Mẹo Chuyên gia Sitemap

    Trang web lớn? Chia nhỏ thành nhiều Sitemap nhỏ: Sitemap có giới hạn 50.000 URL. Vì vậy, nếu bạn vận hành một trang web với rất nhiều trang, Google khuyến nghị chia sitemap của bạn thành nhiều sitemap nhỏ hơn.

    Cẩn thận với các Ngày: Các URL trong sitemap của bạn có một ngày “được sửa đổi lần cuối” liên quan đến chúng.

    Thực hành tốt nhất

    Tôi khuyến nghị thay đổi các ngày này CHỈ khi bạn thực hiện những thay đổi đáng kể trên trang web của bạn (hoặc thêm nội dung mới vào trang web của bạn). Nếu không, Google cảnh báo rằng việc cập nhật ngày trên các trang chưa thay đổi có thể được coi là một chiến lược spam.

    Đừng lo về Video Sitemaps: Schema Video đã chủ yếu thay thế nhu cầu sử dụng video sitemaps. Một video sitemap chắc chắn sẽ không gây hại cho khả năng của trang của bạn để có một đoạn trích video phong phú. Nhưng thường thì không đáng rắc rối.

    Giữ dưới 50MB: Cả Google và Bing đều cho phép sitemap có dung lượng tối đa là 50MB. Vì vậy, miễn là bạn dưới 50MB, bạn làm tốt.

    Sitemap HTML: Đây thực chất là phiên bản tương đương của sitemap XML … nhưng dành cho người dùng.

    Thực hành tốt nhất

    Bạn không nhất thiết cần chúng khi Google và các công cụ tìm kiếm khác hiện đang phụ thuộc vào sitemap XML của bạn. Nhưng nếu bạn nghĩ rằng chúng hữu ích đối với khách truy cập con người, một sitemap HTML có lẽ không làm hại nỗ lực SEO của bạn.

  • Sử dụng Tệp XML để Cấu trúc Liên kết Nội bộ và URL Ngoại vi
  • Tệp XML là một danh sách các URL chỉ đạo cho bot duyệt web đến nội dung và con đường trên một trang web. Do đó, việc sử dụng liên kết nội bộ và liên kết ngoại vi cho sitemap của bạn thông báo cho bot duyệt web những gì được coi là quan trọng trên trang web và giúp giảm sự xuất hiện của các trang mồ côi. Sự rõ ràng như vậy nâng cao sức khỏe SEO tổng thể, điều này tốt cho việc xếp hạng!

    Lưu ý

    Sitemap XML không đảm bảo việc chỉ mục các trang web của bạn mà chỉ tăng cơ hội chỉ mục.

  • Giữ Thư mục Gốc Sạch Sẽ và Tổ chức
  • Thư mục gốc lưu trữ các thư mục và tệp tin khác trên miền, tức là nó là vị trí trung tâm cho tất cả các tệp và thư mục tạo thành một trang web. Tất cả các yêu cầu web bắt đầu từ thư mục gốc.

    Tham khảo  Tìm hiểu về SEO - Tối ưu hóa công cụ tìm kiếm

    Về mặt giả thuyết, bao gồm sitemap của bạn bên ngoài thư mục gốc là vô hại, nhưng điều này đi ngược lại với giao thức đã thiết lập. Vị trí của một sitemap xác định các tệp mà nó có thể chứa. Tôi nghĩ rằng các công cụ tìm kiếm không quan tâm nhiều khi sitemap.xml không được đặt trong thư mục gốc.

    Tránh tắc nghẽn thư mục gốc của bạn với nhiều tệp tin, vì điều này ảnh hưởng đến sự phản hồi của trang web của bạn.

  • Bao gồm TẤT CẢ các Trang Web trong URL Trang Sitemaps
  • Như đã đề cập, sitemaps hoạt động như một con đường cho các bot Google; đưa chúng đến tất cả các trang web trên trang web, ngay cả khi liên kết nội bộ không tốt. Bao gồm tất cả các trang web trong tệp sitemaps cải thiện giao tiếp giữa trang web và các công cụ tìm kiếm.

    Công cụ để Dễ dàng Tạo Sitemap

    Nếu bạn cần tạo một sitemap nhanh chóng, dưới đây là tóm tắt về các công cụ tốt nhất và thuận tiện nhất để xem xét:

  • Công cụ Google Search Console,
  • Công cụ Bing Webmaster,
  • Các công cụ trực tuyến trả phí như Yoast,
  • Rút sitemap từ các trang web bạn không sở hữu.
  • 10 Điều cần Loại trừ trên Sitemaps của Bạn

    Là một thực hành tốt, hãy cố gắng chỉ bao gồm các trang quan trọng về SEO trong sitemap. Đây là một phương pháp được khuyến nghị để tận dụng hiệu quả ngân sách duyệt web.

    Với phương pháp này, các công cụ tìm kiếm duyệt trang web của bạn một cách thông minh, giúp bạn thu được lợi ích từ việc chỉ mục tốt hơn.

    Hãy cố gắng loại trừ:

  • Các trang trùng lặp
  • Các trang phân trang
  • Các trang không chuẩn
  • Các trang lưu trữ
  • Các trang được chuyển hướng (3xx), trang bị thiếu (4xx) và trang lỗi (5xx)
  • Các URL bình luận
  • Các trang không được chỉ mục
  • Các trang tài nguyên hữu ích cho khách truy cập trang web nhưng không phục vụ như trang đích
  • Các trang kết quả tìm kiếm trang web
  • Các trang được chia sẻ qua email
  • Câu hỏi thường gặp

    Làm thế nào để tìm thư mục gốc trong WordPress?

    Đối với các trang web WordPress, /html được coi là thư mục gốc cho các tệp của bạn. Để truy cập vào thư mục gốc, bạn có thể sử dụng SSH, STFP hoặc Trình quản lý tệp tin.

    Một sitemap có ảnh hưởng đến SEO không?

    Có. Sitemap liệt kê tất cả các trang ưu tiên trên một trang web để hướng dẫn các công cụ tìm kiếm trong việc duyệt và chỉ mục. Điều này nâng cao xếp hạng của một trang web, làm cho nó trở nên hiển thị với một số lượng lớn người dùng internet, góp phần tăng cường nỗ lực SEO.

    Tìm hiểu thêm

    Xây dựng và gửi sitemap: Hướng dẫn từ Google về cách tạo sitemap … và cách gửi chúng đến Google.

    Sử dụng Sitemap để giúp Google tìm nội dung được lưu trữ trên trang web của bạn: Video nhanh từ kênh YouTube Google Webmaster về cách sitemap có thể giúp trang web của bạn xuất hiện cao hơn và thường xuyên hơn trong kết quả tìm kiếm.