HTML structure và SEO: Tầm quan trọng hiện nay

Trong trường hợp bạn đã bỏ lỡ tập podcast mới nhất của Search Off the Record, Gary Ilyes của Google đã gây ra một số tranh cãi khi ông phát biểu rằng cấu trúc HTML không quan trọng đối với SEO.

Sau đó, ông đã làm rõ trên Linkedin rằng “không quan trọng lắm” không có nghĩa là “không quan trọng chút nào.” Tuy nhiên, điều đó không ngăn được tranh cãi về SEO.

Vì không thể tránh khỏi tranh cãi, tôi không thể không tham gia vào – nhằm cố gắng làm rõ một số điểm chung và những hiểu lầm tôi thường thấy xuất hiện.

Nhưng vấn đề còn lại của cấu trúc HTML là gì?

Vấn đề chính ở đây là mô hình tư duy của chúng ta về cách công cụ tìm kiếm hoạt động. Đối với hầu hết mọi người, mô hình đó chưa thay đổi kể từ những năm 90 khi công cụ tìm kiếm chủ yếu là tìm kiếm từ vựng. Nghĩa là tìm tài liệu có nhiều nhất các đề cập đến thuật ngữ đó.

Những công cụ tìm kiếm đó có các hàm điểm ghi thêm trọng số cho các trường hợp xuất hiện của thuật ngữ đó in đậm và đếm một H1 nhiều hơn một H2, v.v.

Đáng tiếc cho mô hình tư duy của chúng ta, tìm kiếm đã chuyển từ phương pháp từ vựng sang phương pháp ngữ nghĩa.

Trong tìm kiếm ngữ nghĩa, nội dung được chuyển đổi thành vectơ và các thuật toán như BERT, RankBrain, v.v., được sử dụng để diễn giải “ý nghĩa” của truy vấn và nội dung, không chỉ xem xét những từ nó chứa. Trong quá trình chuyển đổi nội dung thành vectơ, hầu hết các phần tử HTML bị mất.

Ở đây không chỉ có vectơ mà còn có khả năng hiển thị. Trước khi công cụ tìm kiếm có thể hiển thị JavaScript và kiểm tra DOM, chúng phải dựa vào các gợi ý HTML – nhưng những ngày đó đã qua.

Giống như họ có thể sử dụng các thuật toán như passage-bert để xác định đoạn trích liên quan nhất trên trang, họ cũng có thể sử dụng các thuật toán khác nhau để xác định tiêu đề chính – ngay cả khi nó không nằm trong thẻ <h1>.

Chắc chắn, <h1> là một gợi ý ở đây – nhưng cỡ phông chữ, vị trí liên quan đến nội dung và câu chính xác cũng là gợi ý. Chúng ta đã thấy rất nhiều SEO đánh dấu một phần nhỏ của điều hướng với một H1 mặc dù màn hình có một đoạn văn bản 30 điểm lớn giữa màn hình chỉ là một thẻ <span>.

Tham khảo  Bí quyết thành công với blog: Định nghĩa, loại blog và lợi ích chi tiết

Trong những ngày xưa, công cụ tìm kiếm sẽ gặp khó khăn ở đây, nhưng ngày nay, họ có thể nhận dạng chính xác đoạn văn bản <span> lớn đó là “tiêu đề” của trang.

Điều đó không có nghĩa là bạn không nên sử dụng các thẻ H đúng quy tắc và các phần tử lồng nhau. Hãy nhớ rằng khả năng truy cập vẫn quan trọng để cung cấp gợi ý cho các công cụ tìm kiếm. Nếu bạn làm điều đó, nó sẽ trở nên sạch hơn, dễ dàng hơn, dễ truy cập hơn và tổng thể tốt hơn. Tôi chỉ muốn nói rằng các công cụ tìm kiếm không bị ràng buộc bởi đánh dấu.

Một hiểu lầm khác là việc sử dụng nhiều thẻ H1. Đây là một trong những điều tôi không thích nhất.

Với sự giới thiệu của HTML5 và các phần tử khác nhau, việc có nhiều thẻ H1 trên một trang là hoàn toàn bình thường (và, trong một số trường hợp khả năng truy cập, là bắt buộc). Điều này không ảnh hưởng đến nỗ lực SEO của bạn. (Trừ khi bạn đang nạp từ khóa và đánh dấu mọi thứ là H1, điều này có thể gây khó khăn cho một số cờ spam.)

Vậy, công cụ tìm kiếm làm gì? (Tôi sẽ đơn giản hóa ở đây vì tôi có thể đi sâu vào truy xuất thông tin và muốn làm điều đó trong lúc uống bia.)

Đơn giản là:

  • Chúng sẽ phát hiện thẻ tiêu đề, các tiêu đề chính (có thể là H1, H2, v.v.) và nội dung chính.
  • Sau đó, họ sẽ chạy cả các phương pháp từ vựng (ví dụ: BM25) và ngữ nghĩa (ví dụ: độ tương đồng cosine) để xác định tính liên quan của các phần đó đối với truy vấn trước khi đưa tất cả vào một thuật toán học máy và bộ phân loại.
  • Quan trọng là họ có thể không quan tâm liệu đó có phải là H1 hay H2 nữa – chỉ cần thuật toán của họ xác định nó là một “tiêu đề” của trang.

    Cũng vậy với văn bản in đậm, thẻ span và div, v.v. Điều quan trọng là liệu thuật toán (ví dụ: BERT) có cho rằng nó liên quan đến truy vấn hay không.

    Nhận bản tin hàng ngày các nhà tiếp thị tìm kiếm dựa vào.

    Tham khảo  Sử dụng AI để tạo nội dung: Nên hay không nên?

    Vậy cấu trúc HTML có quan trọng cho SEO không?

    Câu trả lời là: Phụ thuộc vào từng trường hợp.

    Khi Illyes đề cập đến cấu trúc HTML, ông có thể đang ám chỉ đến một số điều mà các chuyên viên SEO thích quan tâm:

    • Số lượng thẻ H1 trên một trang.
    • Thứ tự của các thẻ H.
    • Việc sử dụng thẻ <b> hay <strong>.
    • Sử dụng bảng hoặc CSS để tạo kiểu.
    • Vị trí của văn bản trong mã nguồn.

    Đây là những thứ mà tôi đã thấy các chuyên viên SEO thảo luận trong suốt những năm qua, và mặc dù một số trong số chúng có ý nghĩa trong những ngày đầu của SEO, nhưng hiện tại không còn hoạt động như vậy nữa.

    Trước khi đi vào việc HTML có và không có tác động đối với SEO, chúng ta cần lưu ý một số điều.

    Cấu trúc HTML vẫn ảnh hưởng 100% đến khả năng truy cập. Tuy nhiên, khả năng truy cập không phải là yếu tố xếp hạng trực tiếp, nên nó nằm ngoài phạm vi của bài viết này.

    Tôi cũng muốn nhắc lại, như những người khác đã chỉ ra trên X, nếu trang web của bạn không thể truy cập được, khả năng cao là người dùng sẽ không liên kết hoặc nhấp vào nó trong tương lai, điều đó có thể ảnh hưởng đến xếp hạng SEO của bạn.

    Thậm chí Hướng dẫn bắt đầu SEO mới nhất của Google cũng đề cập đến thẻ tiêu đề và khả năng truy cập so với SEO:

    “Sử dụng thứ tự ngữ nghĩa cho các tiêu đề của bạn là tuyệt vời cho các thiết bị đọc màn hình, nhưng từ quan điểm Tìm kiếm Google, không quan trọng nếu bạn sử dụng chúng không theo thứ tự. Web nói chung không tuân thủ HTML hợp lệ, nên Tìm kiếm Google hiếm khi có thể dựa vào ý nghĩa ngữ nghĩa ẩn trong quy định HTML. Cũng không có số lượng tiêu đề lý tưởng, hoàn hảo mà một trang cần có. Tuy nhiên, nếu bạn nghĩ nó quá nhiều, thì có thể là như vậy.”

    Vậy, việc cấu trúc HTML quan trọng ở đâu?

    Cấu trúc HTML thực sự có thể làm hoặc làm hỏng chiến lược SEO của bạn trong rất nhiều trường hợp. Ví dụ, đặt thẻ canonical của bạn trong <body> thay vì <head> sẽ không được nhìn thấy.

    Tương tự, nếu bạn đặt một thẻ <div> trong thẻ <head>, phiên bản của Googlebot’s Chrome sẽ cho rằng bạn đã quên đóng thẻ head và bắt đầu thẻ body và sẽ làm điều đó cho bạn, có thể di chuyển một số thẻ SEO quan trọng của bạn vào phần body nơi chúng sẽ bị bỏ qua.

    Tham khảo  Hướng dẫn Regex cho SEO: Cách sử dụng Biểu thức chính quy (với Ví dụ) | Hướng dẫn đầy đủ về Regex SEO

    Bạn sẽ không tin được tôi thấy điều này xảy ra bao nhiêu lần. Chỉ cần một người vô tình dán mã vào sai vị trí trong Google Tag Manager là có thể làm hỏng toàn bộ trang web của bạn. Vì lý do này mà tôi khuyên khách hàng hãy đảm bảo các thẻ SEO của họ được đặt ở trên cùng trong thẻ <head> hơn bất kỳ thẻ nào khác.

    Các kỹ thuật mã HTML khác cũng có thể gây hại cho SEO.

    Ví dụ, nếu thay vì sử dụng thẻ <a> với thuộc tính href, trang web của bạn có một thẻ <span> với một sự kiện onclick=, các công cụ tìm kiếm sẽ không tính đó là một liên kết, mặc dù người dùng không thể nhận ra sự khác biệt. Nó cũng gặp một số vấn đề về khả năng tiếp cận, vì vậy xin đừng làm điều đó.

    Khi đến với hình ảnh, các công cụ tìm kiếm yêu cầu một thẻ <img> với thuộc tính src=. Bạn sẽ ngạc nhiên khi biết có bao nhiêu plugin tải ảnh lười biếng bỏ qua src= để thay vào đó là srcset=, điều này, theo các thử nghiệm mới nhất của tôi, hoạt động trên trình duyệt hiện đại nhưng không được Google coi là một “hình ảnh” để xếp hạng hình ảnh.

    Tôi không nghĩ rằng bất kỳ ví dụ nào ở trên là những gì Illyes đề cập khi ông nói về cấu trúc HTML. Tôi tin ông đang viện đến các tranh luận phổ biến về việc lồng nhau tiêu đề, thẻ in đậm, vv.

    Có cần lo lắng về việc sử dụng H1, H2 và các thẻ tương tự không?

    Có, luôn luôn cần lo lắng, nhưng không phải vì SEO. Đánh dấu nội dung một cách truy cập và có ý nghĩa cho người dùng. Đừng căng thẳng vì việc ép buộc thẻ <h1> với kiểu dáng giống như văn bản thông thường.

    Có cần kiểm tra tính hợp lệ của HTML?

    Có, nhưng không phải vì thứ hạng SEO. HTML hợp lệ không phải là yếu tố xếp hạng, nhưng nó sẽ giúp ngăn chặn các vấn đề kỹ thuật ảnh hưởng đến SEO và có thể làm giảm công việc về khả năng truy cập. Tôi là một người hâm mộ của W3C Validator.

    Cấu trúc HTML có quan trọng đối với SEO không?

    Tùy thuộc. (Xin lỗi, không thể cưỡng lại được!) Nếu cấu trúc của bạn làm cho nội dung không thể truy cập hoặc không được nhìn thấy, thì đúng là quan trọng. Nếu bạn hy vọng nhận được lợi ích xếp hạng bằng cách sắp xếp lại một số tiêu đề hoặc làm đậm một số văn bản, có thể không xảy ra.

    Quan điểm được thể hiện trong bài viết này thuộc về tác giả khách mời và không nhất thiết phản ánh quan điểm của Search Engine Land. Các tác giả của nhân viên được liệt kê ở đây.

    Tìm hiểu thêm về chúng tôi tại: TRANHUNG Digital

    Đánh giá bài viết