Tìm hiểu về thuật toán Google PageRank
Vào quá khứ, Google PageRank là chỉ số SEO mà mọi người thường nhắc đến. Một tăng trưởng trong điểm PageRank của bạn chứng tỏ chiến lược SEO (đặc biệt là chiến lược xây dựng liên kết) của bạn đang hoạt động.
Tuy nhiên, ngày nay, PageRank hiếm khi được đề cập. Không phải vì nó không còn quan trọng nữa, mà bởi vì nó không còn là một chỉ số công khai.
Trong hướng dẫn này, chúng ta sẽ đi sâu vào mọi thứ bạn vẫn cần biết về thuật toán Google PageRank.
PageRank là một thuật toán của Google được sử dụng để đo độ quan trọng của các trang web dựa trên chất lượng và số lượng liên kết trỏ đến chúng. Nó coi liên kết đến như là phiếu bầu, với các trang nhận được nhiều liên kết chất lượng cao được coi là quan trọng hơn trong kết quả tìm kiếm.
Trước đây, các chuyên gia SEO có thể xem điểm PageRank của bất kỳ trang web nào thông qua thanh công cụ Google.
Điểm PageRank 0 (PR0) đại diện cho các trang chất lượng thấp nhất. Trong khi điểm trang 10 (PR10) đại diện cho các trang có uy tín nhất.
Tuy nhiên, PageRank hoạt động trên một tỉ lệ logarit. Nhiều chuyên gia SEO tin rằng nó có cơ số logarit bằng năm. Điều này có nghĩa là mỗi tăng trưởng tăng đại diện cho một sự tăng trưởng năm lần về quan trọng.
Trong trường hợp này, một trang PR4 sẽ được coi là quan trọng hơn 25 lần so với một trang PR2 (không phải là gấp đôi như tỉ lệ tuyến tính đề xuất).
Lý do vì sao các chuyên gia SEO trở nên quan tâm đến chỉ số này là vì PageRank được chuyển từ một trang web sang trang web khác. Điều này có nghĩa là một trang web có thể có uy tín bằng cách được liên kết từ một trang web khác có điểm PageRank SEO cao hơn.
Đơn giản, PageRank (được chuyển qua các liên kết giữa các trang web) giúp một trang web xếp hạng cao hơn. Và thuật toán được xây dựng dựa trên ý tưởng rằng một trang được coi là quan trọng nếu các trang quan trọng khác liên kết đến nó.
Lịch sử của Google PageRank
- 1 tháng 4 năm 1998: Larry Page và Sergey Brin công bố “The Anatomy of a Large-Scale Hypertextual Web Search Engine”
- 1 tháng 9 năm 1998: Larry Page và Sergey Brin nộp đơn bằng sáng chế PageRank đầu tiên
- 4 tháng 9 năm 1998: Google được thành lập
- 11 tháng 12 năm 2000: Google ra mắt thanh công cụ Google Toolbar
- 17 tháng 6 năm 2004: Google nộp đơn bằng sáng chế về “reasonable surfer”
- 12 tháng 10 năm 2006: Google nộp đơn bằng sáng chế về “seed sets”
- 8 tháng 3 năm 2016: Google thông báo nghỉ hưu Google Toolbar
Người sáng lập Google Lawrence Page (Larry Page) và Sergey Brin đã phát triển PageRank tại Đại học Stanford. Nếu bạn xem xét bài báo giới thiệu về Google, bạn có thể thấy rõ ràng PageRank được nhắc đến khi giải thích các tính năng của công cụ tìm kiếm:
Công cụ tìm kiếm Google có hai tính năng quan trọng giúp nó tạo ra kết quả chính xác cao. Đầu tiên, nó sử dụng cấu trúc liên kết của Web để tính toán một xếp hạng chất lượng cho mỗi trang web. Xếp hạng này được gọi là PageRank … Thứ hai, Google sử dụng liên kết để cải thiện kết quả tìm kiếm.
Bài báo tiếp tục giải thích rằng “đồ thị trích dẫn (liên kết) của web là một nguồn tài nguyên quan trọng mà đã không được sử dụng nhiều trong các công cụ tìm kiếm web hiện có”.
PageRank là điều khiến cho Google trở nên độc nhất vô nhị.
Bằng sáng chế PageRank đầu tiên được nộp vào tháng 9 năm 1998 và trở thành thuật toán ban đầu mà Google sử dụng để tính toán mức độ quan trọng của một trang web.
Đơn giản, Google được hình thành dựa trên ý tưởng rằng thông tin trên web có thể được xếp hạng dựa trên sự phổ biến của các liên kết trang. Một trang nhận được nhiều liên kết trỏ đến thì nó sẽ xếp cao hơn.
Sự giới thiệu của thanh công cụ Google Toolbar
Vào năm 2000, Google ra mắt thanh công cụ Google Toolbar. Đây là một trong những giai đoạn quan trọng nhất trong lịch sử PageRank vì nó cho phép người dùng xem điểm của bất kỳ trang nào.
Do đó, các chuyên gia SEO trở nên quan tâm đến việc tăng điểm PageRank như một cách để cải thiện thứ hạng.
Một giải thích đơn giản của nhiều người vào những năm đầu 2000 là mục tiêu của họ là có được nhiều liên kết nhất có thể từ các trang có điểm PageRank cao nhất.
Tất nhiên, điều này đã dẫn đến việc thao túng PageRank, với sự trao đổi tiền bạc để có được liên kết. Liên kết được đặt ở vị trí không tự nhiên và số lượng lớn.
Bằng sáng chế PageRank ban đầu từ năm 1998 đã hết hạn vào năm 2018 và, một cách đáng ngạc nhiên, không được gia hạn. Vào thời điểm này, một cựu nhân viên Google xác nhận rằng thuật toán ban đầu không được sử dụng kể từ năm 2006.
Nhưng điều đó không có nghĩa là PageRank đã chết. Trái lại, PageRank vẫn còn sống.
Bằng sáng chế ban đầu có vẻ như đã được thay thế bằng bằng sáng chế mới này. Mà Google nộp vào năm 2006.
Bằng sáng chế này đề cập đến “seed sites in the trusted seed sets” và xác định chúng là “… các trang chất lượng cao được chọn lọc đặc biệt cung cấp sự kết nối web tốt cho các trang không phải là seed khác,” với hai ví dụ cụ thể là Google Directory (vẫn hoạt động khi bằng sáng chế được nộp) và The New York Times.
“[Các seed sites] cần được tin cậy, đủ đa dạng để bao gồm một loạt các lĩnh vực quan tâm của công chúng và kết nối tốt với các trang web khác. Chúng phải có số lượng lớn các liên kết đi ra hữu ích để dễ dàng xác định các trang khác hữu ích và chất lượng cao, họ hoạt động như là “trung tâm” trên web.”
Bằng sáng chế mới nhìn vào việc cung cấp một điểm xếp hạng cho một trang web dựa trên khoảng cách nó cách khỏi tập hợp seed. Tuy nhiên, bằng sáng chế này không thực sự đề cập đến PageRank (hoặc tuyên bố là phiên bản cập nhật của thuật toán).
Thay vào đó, cộng đồng SEO hiểu rằng nó hoạt động như một bộ điều chỉnh PageRank dựa trên sự gần gũi với tập hợp seed các trang web.
Sau gần 15 năm, Google đã ngừng cập nhật Google Toolbar. (Cập nhật cuối cùng được xác nhận là vào tháng 12 năm 2013.) Công ty hoàn toàn chấm dứt nó vào năm 2016.
Tất nhiên, điều này không có nghĩa là Google đã ngừng sử dụng PageRank như một phần của thuật toán. Chỉ là PageRank không còn là một chỉ số công khai.
Tại sao Google nghỉ hưu thanh công cụ PageRank?
SEOs trở nên ám ảnh với PageRank. Và nhanh chóng nó trở thành chiến thuật SEO được tập trung nhiều nhất, thậm chí vượt qua việc tạo nội dung tốt và trải nghiệm người dùng tốt.
Vấn đề là điểm PageRank công khai dễ bị SEO thao túng.
SEOs biết làm thế nào để sử dụng PageRank để xếp hạng cao hơn trang web của họ. Và họ đã tận dụng điều đó.
Nếu nhìn vào từ góc nhìn của Google, PageRank công khai là vấn đề. Mà không có nó, không có một đo lường chính xác về uy tín của một trang web (ít nhất là chính thức). Vì vậy, việc thao túng điểm trở nên khó khăn hơn.
Cuối cùng, SEOs lạm dụng PageRank và sử dụng nó để thao túng thứ hạng trang. Điều này có thể là một phần lớn lý do tại sao Google nghỉ hưu thanh công cụ vào năm 2016.
Khi bằng sáng chế được nộp lần đầu tiên và thuật toán ban đầu của Google được phát triển, PageRank dựa trên lý thuyết rằng một liên kết từ một trang web khác đến một trang web khác là một phiếu bầu cho sự tin tưởng và uy tín.
Do đó, mỗi liên kết (phiếu bầu) trỏ đến một trang được xem xét. Số lượng liên kết (phiếu bầu) trỏ đến một trang sẽ quyết định mức độ tin tưởng và thứ hạng của trang đó.
Tuy nhiên, như được định nghĩa trong bài báo ban đầu, “PageRank mở rộng ý tưởng này bằng cách không tính toán liên kết từ tất cả các trang một cách bình đẳng, và bằng cách chuẩn hóa theo số lượng liên kết trên một trang.”
Một liên kết không chỉ đơn giản là một phiếu bầu. Sự uy tín của một trang được tính đến. Một liên kết từ trang PR6 cuối cùng là một phiếu bầu có uy tín hơn so với một trang PR2.
Và dòng chảy của PageRank giữa các trang web đôi khi được gọi bởi các chuyên gia SEO là “link juice”.
Hãy xem xét các phép tính đằng sau PageRank:
Chúng ta giả định trang A có các trang T1…Tn trỏ đến nó (tức là các trích dẫn). Tham số d là hệ số giảm năng lượng có thể được đặt giữa 0 và 1. Thông thường chúng ta đặt d là 0,85. Có thêm chi tiết về d trong phần tiếp theo. Ngoài ra, C(A) được định nghĩa là số lượng liên kết đi ra từ trang A. PageRank của một trang A được cho như sau: PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn)) Lưu ý rằng các PageRank tạo thành một phân phối xác suất trên các trang web, vì vậy tổng của tất cả PageRank của các trang web sẽ là một.”The Anatomy of a Large-Scale Hypertextual Web Search Engine,” Sergey Brin và Larry Page
Đơn giản, PageRank của trang B được tính bằng cách nhân PageRank của trang A với 0,85. Điều này được gọi là hệ số giảm năng lượng.
Nếu trang B sau đó liên kết đến trang C, điều này nhận được 85% PageRank của B (tương đương với 72,25% PageRank của trang A).
Nếu một trang web không có liên kết trỏ đến nó, trang đó không có PR0, mà là PR0,15.
Tuy nhiên, mọi thứ trở nên phức tạp hơn khi có nhiều hơn một liên kết ngoại trên một trang. Càng nhiều liên kết trên một trang, thì sức mạnh của chúng càng bị pha loãng.
Điều đó có nghĩa là khi một trang chỉ liên kết đến trang web của bạn một cách độc quyền, nó sẽ có lợi hơn so với việc liên kết đến nhiều trang web khác nhau.
Lưu ý: Các quy trình được mô tả ở trên đề cập đến thông tin trong một bài báo được công bố bởi những người sáng lập Google vào năm 1998. PageRank và các thuật toán liên quan có thể đã thay đổi kể từ thời điểm đó.
Các yếu tố ảnh hưởng đến PageRank (và vẫn quan trọng)
Tất nhiên, có những yếu tố ảnh hưởng đến PageRank. Chúng ta đã đề cập đến việc không phải tất cả các liên kết đều bằng nhau về PageRank mà chúng truyền.
Nhưng có những yếu tố nào có thể ảnh hưởng đến PageRank – hoặc từng ảnh hưởng trong quá khứ?
Chúng ta sẽ xem xét cụ thể:
Anchor Text
Anchor text là văn bản mà liên kết được gắn kết vào.
Bài báo ban đầu của Google đã nêu rõ rằng “văn bản của liên kết được xử lý một cách đặc biệt trong công cụ tìm kiếm của chúng tôi” và rằng “anchor thường cung cấp mô tả chính xác hơn về các trang web so với các trang web đó.”
Vào những ngày đầu của Google, anchor text có ảnh hưởng quan trọng đến thứ hạng của một trang.
Nếu bạn muốn xếp hạng cho thuật ngữ “giày màu đỏ”, số lượng liên kết sử dụng cụm từ đó làm anchor text càng nhiều, bạn sẽ xếp hạng cao hơn. (Về lý thuyết.)
Xây dựng liên kết trở thành một cuộc đua giữa các SEO để xem ai có thể có nhiều liên kết anchor text chính xác nhất từ các trang có PageRank cao nhất.
Tuy nhiên, ngày nay, Google coi việc thao túng anchor text là một hình thức của thư rác liên kết. Tham gia vào việc này có thể dẫn đến một trừng phạt thủ công ảnh hưởng đến thứ hạng của bạn.
Xác suất một liên kết được nhấp chuột
Xác suất một liên kết được nhấp chuột là một yếu tố quan trọng ảnh hưởng đến PageRank. Nó được đề cập đến trong bằng sáng chế reasonable surfer của Google (được nộp vào năm 2004).
Thuật toán PageRank ban đầu gán trọng số bằng nhau cho các liên kết trên một trang. Trong khi bằng sáng chế này ngầm định rằng không phải tất cả các liên kết đều có cùng khả năng được nhấp chuột. Vì vậy, các liên kết nên mang các trọng số khác nhau.
Ví dụ, các liên kết trong các vị trí sau đây ít có khả năng được nhấp chuột hơn so với các liên kết trong các vị trí nổi bật. Và do đó, nên mang trọng số nhẹ hơn.
- Trang điều khoản dịch vụ
- Quảng cáo banner
- Chân trang trang web
Liên kết nội bộ
Liên kết nội bộ là liên kết giữa các trang trên trang web của bạn. (Khác với backlink, là các liên kết đến trang của bạn từ các miền khác.)
Liên kết nội bộ là một chiến thuật SEO mạnh mẽ.
Ý tưởng là bạn có thể giúp PageRank lưu thông qua trang web của bạn với một cấu trúc liên kết nội bộ vững chắc.
Đây là một cách tốt để tạo uy tín cho các trang mồ côi – các trang không được liên kết từ bất kỳ đâu khác.
Bạn có thể tìm hiểu thêm về cách sử dụng hiệu quả chiến thuật này trong hướng dẫn về liên kết nội bộ của chúng tôi.
Liên kết nofollow
Liên kết nofollow là các liên kết chứa thuộc tính rel = “nofollow”. Ban đầu, liên kết nofollow không truyền PageRank.
Lịch sử, một số SEO đã sử dụng thuộc tính nofollow để điều chỉnh dòng PageRank. Thực hành này đã được gọi là “PageRank sculpting”.
Những người tham gia vào việc điều chỉnh PageRank sẽ, ví dụ, viết bài đăng khách mời với liên kết đến năm trang web khác nhau. Và sử dụng nofollow cho tất cả các liên kết trừ liên kết chỉ trỏ đến trang web của họ. Đảm bảo rằng họ nhận được toàn bộ “nước” liên kết.
Vào năm 2009, Matt Cutts của Google cho rằng PageRank sculpting sẽ không hoạt động. Bởi vì PageRank vẫn bị pha loãng bởi sự hiện diện của liên kết nofollow.
Vào năm 2019, Google thông báo rằng nó sẽ coi thuộc tính nofollow như “gợi ý”. Nghĩa là nó sẽ quyết định liệu các liên kết này có nên truyền PageRank hay không.
Để biết thêm thông tin, hãy xem hướng dẫn của chúng tôi về liên kết nofollow, sponsored và UGC.
Chỉ vì không còn thanh công cụ thể hiện điểm PageRank của một trang web không có nghĩa là nó không còn được sử dụng.
Vào năm 2017, Gary Illyes của Google đã xác nhận trên Twitter rằng thuật toán vẫn sử dụng PageRank.
John Mueller của Google xác nhận điều này lại vào năm 2020:
Tuy nhiên, thuật toán PageRank đã khác rất nhiều so với ban đầu, như Matt Cutts của Google viết vào năm 2009.
“Mặc dù chúng tôi vẫn gọi nó là PageRank, khả năng tính toán uy tín dựa trên liên kết của Google đã phát triển rất nhiều qua các năm.” – Matt Cutts
PageRank chưa bao giờ biến mất. Và hiểu cách nó hoạt động chỉ giúp bạn trở thành một SEO tốt hơn.
Google không có phần mềm chính thức cho phép bạn đo lường PageRank.
Tuy nhiên, Authority Score của Semrush cung cấp một cách thay thế khác để đánh giá sức mạnh xếp hạng của trang web của bạn.
Authority Score là một chỉ số tên miền hợp chất đánh giá chất lượng tổng thể của một trang web và cho biết mức độ ảnh hưởng của một liên kết từ trang đó có thể ảnh hưởng đến SEO của bạn.
Đây chắc chắn không phải là một thay thế trực tiếp cho PageRank. Nhưng Authority Score có thể cung cấp cho bạn một số thông tin tương tự như điểm PageRank trong thanh công cụ.
Điểm (từ 0 đến 100) dựa trên:
- Sức mạnh liên kết: Chất lượng và số lượng liên kết trở lại
- Lưu lượng hữu cơ: Ước tính lưu lượng tìm kiếm hữu cơ hàng tháng
- Các yếu tố thư rác: Chỉ số của hồ sơ liên kết spam hoặc tự nhiên
Bạn có thể kiểm tra Authority Scores của đối thủ của mình bằng công cụ Backlink Analytics của Semrush.
Chỉ cần nhập URL sau đó nhấp vào “Phân tích”.
Sau đó, bạn có thể thêm tối đa bốn đối thủ để so sánh Authority Scores của họ. Và truy cập vào các chỉ số hữu ích khác.
Backlink Audit của Semrush giúp bạn theo dõi Authority Score và các liên kết trở lại của riêng bạn.
Sau khi hoàn tất thiết lập, tab “Tổng quan” sẽ hiển thị xu hướng Authority Score của bạn.
Sử dụng báo cáo “Kiểm tra” để xem xét các liên kết trở lại bạn đã nhận được.
Lưu ý quan trọng: Authority Score sử dụng dữ liệu liên kết trở lại làm phần của thuật toán xếp hạng nhưng không dự định thay thế trực tiếp PageRank của Google. Thay vào đó, nó có thể giúp bạn đánh giá cơ hội liên kết và so sánh tên miền của bạn với đối thủ.
Hãy nhớ rằng các chỉ số của bên thứ ba không được sử dụng trong thuật toán của Google. Một Authority Score cao không nhất thiết dẫn đến xếp hạng cao hơn.
Để cải thiện PageRank của bạn, bạn cần cải thiện các liên kết nội bộ và xây dựng liên kết chất lượng cao cho trang web của bạn.
Có nhiều chiến lược xây dựng liên kết mà bạn có thể sử dụng, chẳng hạn như:
- Liên lạc: Chia sẻ nội dung của bạn với các nhà xuất bản có thể muốn liên kết đến nó
- Xây dựng liên kết hỏng: Tìm các liên kết hỏng và yêu cầu chủ sở hữu sửa chúng
- Viết bài khách mời: Viết nội dung chất lượng cao cho các trang có liên quan
- HARO (Help a Reporter Out): Trả lời các yêu cầu truyền thông trực tuyến
Hoặc, bắt đầu trực tiếp với Công cụ Xây dựng liên kết của Semrush.
Công cụ phân tích hồ sơ của bạn để tìm cơ hội liên kết. Và giúp bạn quản lý toàn bộ quá trình xây dựng liên kết.
Nguồn tham khảo: https://www.semrush.com/blog/pagerank/