Googlebot Thu Thập Dữ Liệu Và Lập Chỉ Mục Nội Dung HTML 15 MB Đầu Tiên

Trong bản cập nhật cho tài liệu trợ giúp của Googlebot, Google đã âm thầm thông báo rằng họ sẽ thu thập dữ liệu 15 MB đầu tiên của một trang web. Bất cứ điều gì sau khi cắt giảm này sẽ không được đưa vào tính toán bảng xếp hạng.

Google chỉ định trong tài liệu trợ giúp:

“Bất kỳ tài nguyên nào được tham chiếu trong HTML như hình ảnh, video, CSS và JavaScript đều được tìm nạp riêng. Sau 15 MB đầu tiên của tệp, Googlebot ngừng thu thập dữ liệu và chỉ xem xét 15 MB đầu tiên của tệp để lập chỉ mục. Giới hạn kích thước tệp được áp dụng cho dữ liệu không nén.”

Điều này khiến một số người trong cộng đồng SEO tự hỏi liệu điều này có nghĩa là Googlebot sẽ hoàn toàn bỏ qua văn bản rơi xuống dưới hình ảnh khi bị cắt trong các tệp HTML hay không.

“Nó dành riêng cho chính tệp HTML, giống như nó được viết,” John Mueller, Người ủng hộ Tìm kiếm của Google, làm rõ qua Twitter. “Tài nguyên / nội dung nhúng được kéo vào bằng thẻ IMG không phải là một phần của tệp HTML.”

Điều này có ý nghĩa gì đối với SEO

Để đảm bảo googlebot có trọng số, nội dung quan trọng hiện phải được đưa vào gần đầu trang web. Điều này có nghĩa là mã phải được cấu trúc theo cách đặt thông tin liên quan đến SEO với 15 MB đầu tiên trong HTML hoặc tệp dựa trên văn bản được hỗ trợ.

Nó cũng có nghĩa là hình ảnh và video nên được nén không được mã hóa trực tiếp vào HTML, bất cứ khi nào có thể.

Các phương pháp hay nhất về SEO hiện khuyên bạn nên giữ các trang HTML ở 100 KB trở xuống , vì vậy nhiều trang web sẽ không bị ảnh hưởng bởi thay đổi này. Bạn có thể kiểm tra kích thước trang bằng nhiều công cụ khác nhau, bao gồm cả Thông tin chi tiết về tốc độ trang của Google.

Về lý thuyết, nghe có vẻ đáng lo ngại khi bạn có thể có nội dung trên một trang không được sử dụng để lập chỉ mục. Tuy nhiên, trên thực tế, 15MB là một lượng HTML lớn đáng kể.

Như Google tuyên bố, các tài nguyên như hình ảnh và video được tìm nạp riêng. Dựa trên từ ngữ của Google, có vẻ như mức cắt giảm 15MB này chỉ áp dụng cho HTML.

Sẽ rất khó để vượt quá giới hạn đó với HTML trừ khi bạn xuất bản toàn bộ văn bản có giá trị của sách trên một trang duy nhất.

Nếu bạn có các trang vượt quá 15MB HTML, có khả năng bạn có các vấn đề cơ bản cần được khắc phục.

Nguồn bài viết : Google Search Central

Nguồn tin: Link

Scroll to Top