NLP (Natural Language Processing). Thật sự có đóng vai trò trong SEO hay chỉ là một thuật ngữ “geeky” được sử dụng trong giới SEO kỹ thuật quá tư duy?
“Khi mọi người nhận ra NLP đứng cho Natural Language Processing thay vì một số thuật ngữ ảo tưởng những năm 1970, họ sẽ nhận ra rằng nó không chỉ tồn tại mà còn là nền tảng chính của khẩu hiệu “tổ chức thông tin thế giới”. Thông tin không chỉ liên quan đến website, vì vậy Google cần một kho lưu trữ riêng để lưu trữ ý tưởng, chủ đề và “điều gì đó”. NLP (và NLU và BERTs và BERTIEs và Word2Vec, CBOW và cả nGrams và nhiều phương pháp toán học khác) là những nỗ lực để biến ý tưởng con người thành cấu trúc máy hiểu được. Google đã mua Freebase với một số tiền lớn và bây giờ có vẻ như công ty đang được điều hành bởi những tiên tri của phương pháp này để hiểu về nỗ lực con người. Nó đang đi đến nơi… nhưng nó không bao giờ biến mất!” – Dixon Jones, CEO Inlinks.net
Thỉnh thoảng, một thay đổi trong thuật toán diễn ra và nếu bạn may mắn là một trong những người đầu tiên nhận ra và thích nghi với SEO của mình, bạn sẽ thu được phần thưởng lớn trong khi mọi người khác đang cố gắng bắt kịp.
Vì vậy, những chuyên gia SEO thông minh luôn kiểm tra xem thay đổi quan trọng tiếp theo đến từ đâu.
Trong trường hợp đó, liệu NLP có phải là một trong những yếu tố thay đổi trò chơi? Có vẻ như nó có thể là như vậy.
Nghiên cứu gần đây của chúng tôi khi hợp tác với các chuyên gia SEO khác nhau và được tôn trọng trong ngành đã cho thấy kết quả đáng kể khi tối ưu hóa NLP được triển khai.
Nhưng hãy quay trở lại với điểm xuất phát. Hãy để tôi giúp bạn hiểu rõ hơn:
– NLP là gì
– Nó liên quan như thế nào đến thuật toán của Google.
– Tại sao nó quan trọng
– Cách thực tế để bạn có thể triển khai NLP vào SEO của mình.
Vào cuối năm 2019, Google thông báo về việc phát hành thuật toán BERT chính thức. Sự thật là họ thông báo điều đó đồng nghĩa với việc nó là một điều gì đó đáng kể, và Google đã xác nhận điều này khi họ tuyên bố rằng việc triển khai đầy đủ ảnh hưởng đến 10% số truy vấn tìm kiếm.
“Bằng cách cố gắng hiểu ‘bối cảnh’ của các truy vấn tìm kiếm và bằng cách khai thác mối quan hệ giữa từ dừng với các từ khác trong truy vấn, thuật toán BERT của Google đẩy giới hạn về cách một công cụ tìm kiếm truyền thống hiểu nhu cầu của người dùng. Với việc Google đầu tư vào NLP để hiểu sâu hơn nhu cầu của người dùng, điều đó ngụ ý rằng những người tạo nội dung nếu trở nên cụ thể, có liên quan và mô tả hơn với nội dung và thông tin (bao gồm liên kết) trong trang của họ sẽ có xu hướng xếp hạng cao hơn.” – Jaya Kumar Data Scientist, Deep Learning and NLP Specialist
Cách tốt nhất để hiểu về NLP từ góc độ SEO là hiểu rõ về BERT trước.
BERT viết tắt của Bidirectional Encoder Representations from Transformers.
BERT bao gồm hai thành phần chính: dữ liệu (mô hình được huấn luyện trước) và phương pháp học (cách xác định và sử dụng các mô hình đó).
Khi chúng ta nói về các mô hình, chúng ta đề cập đến các bộ dữ liệu cụ thể. Vì vậy, BERT thu thập các bộ dữ liệu cụ thể liên quan đến nội dung và sau đó học cách phân tích dữ liệu đó.
NLP là bộ não của BERT. Nó có khả năng hiểu từ hoặc cụm từ trong ngữ cảnh của nó bằng cách xem xét các tín hiệu khác nhau xung quanh nó. Từ các từ trước đó cho đến các từ đứng trước nó. Từ phần của trang đến toàn bộ trang.
Nếu bạn có thể phân tích nội dung trên các trang mà Google xếp hạng cao và xem xét nội dung trước và sau các cụm từ và từ, sau đó tối ưu hóa trang của bạn để cung cấp một cái gì đó tương tự, bạn sẽ có thể cung cấp cho Google một cái gì đó rất giống với các trang xếp hạng hàng đầu.
Đó là những gì NLP đại diện và, với cập nhật thuật toán BERT, Google đang sử dụng nó.
Google không còn chỉ nhìn vào từng từ hoặc cụm từ riêng lẻ, như chúng ta đã hiểu trong quá khứ khi thực hiện nghiên cứu từ khóa theo cách truyền thống. Nhưng bây giờ họ đang nhìn vào các câu, đoạn văn và truy vấn như một thể thống nhất. Họ đang nhìn vào tâm trạng.
“Quan trọng là nhớ rằng NLP đã tồn tại từ hàng thập kỷ. Đây không phải là “công nghệ mới” mà Google bất ngờ áp dụng. Họ luôn sử dụng nó, dưới một hình thức nào đó. Bây giờ, đó là BERT nhưng nó có thể thay đổi khi các phát triển trong lĩnh vực này tiến triển. NLP rất hữu ích để so sánh các chủ đề bạn đã đề cập trong nội dung của bạn với nội dung của đối thủ. Tôi chủ yếu sử dụng nó như một cách để xem xem tôi có thể đã bỏ sót điều gì không, hoặc tôi có nên thêm nội dung hỗ trợ xung quanh nội dung chính.Hãy nhớ rằng, khi nội dung của bạn hoàn thành, hãy lùi lại và đánh giá xem nội dung của bạn có hợp lý không. Các công cụ tìm kiếm sẽ không bao giờ mua hàng từ bạn, người dùng sẽ làm điều đó. Hãy cung cấp cho người dùng những gì họ muốn!” – Steven van Vessum, Phó Chủ tịch Cộng đồng tại ContentKing
Hiểu về NLP từ quan điểm của Google
Khi cố gắng dự đoán và tiến triển cùng Google, chúng ta luôn cần nhìn vào sự tiến triển của thuật toán từ quan điểm của Google. Họ đang tìm kiếm điều gì từ các cập nhật và việc giới thiệu NLP?
Đáp án là chất lượng tìm kiếm.
Với Google, trải nghiệm người dùng là yếu tố quan trọng để duy trì hoạt động.
Người dùng đã chiếm đoạt một thế hệ của internet. Họ thông minh hơn trong việc tìm kiếm và cụ thể hơn về những gì họ muốn thấy. Họ cũng kiên nhẫn hơn và Google phải tiếp tục điều chỉnh hoặc cải thiện, nếu không một công cụ tìm kiếm khác sẽ làm điều đó và sự thống trị của Google trên thế giới sẽ tan biến.
Theo thông tin chúng tôi có được trên blog của Google, 15% truy vấn tìm kiếm được sử dụng lần đầu tiên. Mọi người đang sử dụng ngày càng nhiều truy vấn dài hơn để tìm câu trả lời cho câu hỏi của họ, đặc biệt là với sự gia tăng của tìm kiếm bằng giọng nói.
Điều đó có nghĩa là đôi khi thuật toán không có đủ dữ liệu lịch sử để đoán trước ý định sau truy vấn tìm kiếm, vì vậy nó sẽ gặp khó khăn trong việc hiểu người dùng đang tìm kiếm gì.
Chìa khóa là hiểu ngôn ngữ tốt hơn. NLP là cách mà Google làm điều đó.
Hãy nghe câu tuyên bố từ bài viết của Pandu Nayak:
“Với các tiến bộ mới nhất từ nhóm nghiên cứu của chúng tôi trong lĩnh vực ngôn ngữ hiểu – được thực hiện nhờ học máy – chúng tôi đang cải thiện đáng kể cách chúng tôi hiểu các truy vấn, đây là cột mốc lớn trong 5 năm qua và một trong những bước nhảy vọt quan trọng nhất trong lịch sử tìm kiếm.”
[Ebook] SEO Kỹ thuật cho những người suy nghĩ không kỹ thuật
SEO kỹ thuật là một trong những lĩnh vực SEO phát triển nhất hiện nay. Nó liên quan đến việc tìm kiếm các giải pháp SEO dựa trên cách và vì sao các công cụ tìm kiếm – và các trang web – hoạt động. Cuốn sách điện tử này là tất cả những gì bạn luôn muốn chia sẻ với khách hàng, bạn bè và đồng đội tiếp thị của bạn.
Nội dung quan trọng hơn cả, nó là vương quốc
“BERT của Google là một trong những bước tiến lớn và to lớn nhất trong việc phát triển tổng thể của Tìm kiếm Google trong những năm qua. Sức mạnh thực sự của BERT của Google đến từ Transformer, cơ chế chú ý nhận thức được mối quan hệ ngữ cảnh giữa các từ trong một văn bản. ELMo và ULMFiT là 2 thành phần khác của BERT – thành phần đầu tiên giải quyết vấn đề đa nghĩa trong NLP và thành phần thứ hai cải thiện đáng kể quá trình học chuyển giao. Với BERT, chúng ta đã chú ý đến từ tiếp theo và trước đó, chú ý đến các từ đồng nghĩa/liên quan, các từ liên quan trong các câu khác, chú ý đến các từ khác dự đoán từ, chú ý đến các từ phân cách. Điều này làm cho quá trình học và kiểm tra từ chứa trong một truy vấn trở nên phức tạp và chính xác hơn trước đây” – Dido Grigorov, Trưởng phòng SEO, Serpact
Nhiều câu chứa “từ dừng” hoặc các từ có nhiều ý nghĩa, như “to”, “in”, “get-go”, v.v. Những từ này có quá nhiều mục đích khiến Google khó hiểu ngữ cảnh, ngay cả khi học máy phát triển nhanh chóng như hiện nay.
Đó là lúc cảm xúc xuất hiện. Đó là một công cụ khác mà Google đã phát triển để hiểu nội dung.
Bằng cảm xúc, chúng tôi có nghĩa là dấu hiệu hay cảm giác được thể hiện trong nội dung. Nó có thể tích cực, tiêu cực và trung lập, và có thể mở rộng.
Một cách đơn giản, cảm xúc tích cực có nghĩa là sử dụng các từ tích cực, như xuất sắc, giá cả hợp lý và giảm nhẹ. Bất cứ điều gì trong bối cảnh như vậy có ý nghĩa hoặc kết quả tích cực. Ví dụ:
“Loại thuốc này tuyệt vời, nó hoạt động thực sự, nó giảm đau và giá cả hợp lý nữa.”
Chúng được gán một điểm cảm xúc từ 0,25 đến 1, trong khi ngược lại, cảm xúc tiêu cực được gán một điểm từ -0,25 đến -1,0.
Chúng ta còn có cảm xúc trung lập, khi điểm cảm xúc nằm giữa hai con số đó. Vì vậy, giữa -0,25 và +0,25.
Chúng ta cũng biết rằng Google xem xét cảm xúc cả trên trang và cả trên các phần nhỏ trang.
Tại sao cảm xúc quan trọng đối với SEO?
Một cách đơn giản, nếu tất cả kết quả trên trang 1 đều cung cấp cảm xúc tích cực và trang của bạn phần lớn được phân loại là có cảm xúc tiêu cực, có khả năng cao Google sẽ không xem trang của bạn có liên quan đến những gì người dùng đang tìm kiếm.
Bạn cần biết điều gì là “thực thể”…
Nếu bạn muốn tìm hiểu sâu hơn về NLP và bắt đầu làm việc với nó (chúng tôi khuyên bạn nên làm điều này), bạn sẽ gặp thuật ngữ “thực thể”, và đó là điều quan trọng khi hiểu về NLP và cách nó hoạt động.
Thực thể là một từ hoặc cụm từ đại diện cho một đối tượng có thể được nhận dạng, phân loại và phân loại.
Ví dụ về các đối tượng bao gồm:
– cá nhân
– hàng tiêu dùng
– sự kiện
– số lượng
– tổ chức
NLP có nhiệm vụ chọn lọc và đánh giá các thực thể này từ nội dung của bạn.
Do Google phân biệt các thực thể này, công cụ tìm kiếm có khả năng sử dụng thông tin này để đáp ứng người dùng và cung cấp kết quả tìm kiếm tốt hơn.
Với NLP, hai chỉ số bổ sung quan trọng là tầm quan trọng và danh mục.
Danh mục – không có gì đáng giải thích. Như các SEO, chúng ta đã quen với việc danh mục quan trọng.
Tầm quan trọng – trong NLP đại diện cho mức độ quan trọng của thực thể trong văn bản.
Ví dụ, từ “buổi sáng” có thể quan trọng hơn “buổi tối” khi nói về bữa sáng. Vì vậy, Google sẽ đánh điểm tầm quan trọng cao hơn cho “buổi sáng” hơn là “buổi tối” trong ngữ cảnh này.
Thực thể được gán một điểm tầm quan trọng trong khoảng từ 0.0 đến 1.0. Giá trị tầm quan trọng càng cao, thực thể càng quan trọng và liên quan đến chủ đề của trang.
Google đang đặt từ vào ngữ cảnh và xếp hạng các thực thể theo độ quan trọng đối với ngữ cảnh của trang.
Hiểu về NLP: tổng hợp tất cả
Chúng tôi đã đề cập đến các nền tảng của NLP và đặc biệt là mối quan hệ của nó với BERT. Hãy nhớ lại nhanh trước khi chuyển sang nói về cách chúng ta có thể tích hợp NLP vào một số chiến lược và quy trình SEO của chúng ta.
NLP là quá trình mà Google đã tích hợp để hiểu tốt hơn các từ khóa hoặc cụm từ chính trên một trang bằng cách xem xét nội dung xung quanh chúng.
Đó có thể là một từ ngay trước và sau “thực thể” được phân tích, ngữ cảnh của phần văn bản, hoặc toàn bộ trang. Sau đó, chúng ta có thể xem xét nó từ quan điểm của cảm xúc. Một mảnh nội dung có cảm xúc như thế nào so với những mảnh khác đang xếp hạng?
Cuối cùng, có danh mục và tầm quan trọng. Làm sao bạn có thể phân loại mảnh nội dung này? Chúng ta xếp hạng các thực thể liên quan đến nội dung xung quanh để xác định sự quan trọng. Một số từ quan trọng hơn các từ khác trong ngữ cảnh cụ thể.
Hiểu về NLP: đặt tất cả vào một
Chúng tôi đã đề cập đến nền tảng của NLP và đặc biệt là mối quan hệ của nó với BERT. Hãy nhắc lại nhanh trước khi chuyển sang nói về cách chúng ta có thể tích hợp NLP vào một số chiến lược và quy trình SEO của chúng ta.
NLP trong SEO đòi hỏi quy trình kiểm tra và tối ưu hóa kỹ lưỡng. Điều này có thể tốn thời gian, nhưng nó thực sự giúp xác định chiến lược nội dung và giảm lãng phí tài nguyên.
Rủi ro và lợi ích? Rủi ro lớn nhất khi tập trung vào NLP là không nghiên cứu kỹ. Chúng tôi thấy nó rất hiệu quả sau khi đã phân tích không chỉ trang web của khách hàng mà còn các trang đối thủ. Điều này giúp chúng tôi thấy NLP đang có tác động như thế nào trong một lĩnh vực cụ thể với một số độ chắc chắn – đoán là có thể gây hại và làm suy yếu lý do chính để sử dụng NLP ban đầu.
Chúng tôi sử dụng NLP để hiểu nơi mà khách hàng của chúng tôi được coi là chuyên gia và sử dụng nó cho các chiến lược nội dung dựa trên bằng chứng. Chúng tôi có thể tối ưu hóa nội dung tốt hơn nhưng quan trọng hơn cả là chúng tôi có thể táo bạo hơn trong việc vị trí toàn bộ trang web trong một lĩnh vực cụ thể.
Tương lai của Buzz? Khi ngành SEO lần đầu tiên tiếp cận các công cụ để sử dụng NLP, có rất nhiều sự hào hứng. Nhưng nhiều thứ đó đã giảm đi. Đó không phải là cách sửa nhanh mà nhiều người trong SEO đang tìm kiếm. Tuy nhiên, NLP luôn là một phần của tìm kiếm và nếu bạn dành thời gian cho nó, nó có thể trở thành một phần không thể thiếu trong các chiến dịch SEO của bạn.
Chúng tôi xin cảm ơn Michał Suski từ Surfer SEO đã cung cấp dữ liệu tuyệt vời và giúp đỡ chúng tôi trong chủ đề NLP này.
Bình luận từ các chuyên gia trong ngành…
“Thuật toán Bert của Google cuối cùng cũng tìm hiểu thêm ngữ cảnh trên một trang. Quan trọng là xem xét các lớp từ khóa chính được bao gồm trong kết quả trang đầu tiên và điều chỉnh nội dung của bạn để phù hợp. Tôi đã thành công trong việc phân tích nội dung trên trang đầu cho các từ khóa chính và phụ và từ khóa cha để tạo ra nội dung tốt hơn. Ví dụ, một người dùng có thể tìm kiếm ‘những trang trại rượu vang tốt nhất ở Úc’. Khi bạn phân tích các kết quả trang đầu cho từ khóa được đề cập nhiều nhất và sự giao nhau của chúng với các đối thủ của họ, bạn sẽ nhận thấy một mô hình. Mô hình đó là những gì Google đang chú ý, người dùng của họ đang tìm kiếm điều gì. Ví dụ, tôi có thể có một bài viết về những trang trại rượu vang hàng đầu ở Úc và điều làm cho chúng trở nên tốt nhất trong một bài viết trên trang đầu. Kết quả khác tôi có thể nhắc đến một số trang trại rượu vang tuyệt vời ở Úc nhưng họ cũng bao gồm các loại nho chính ở Úc trước tiên. Nếu tôi muốn tạo ra một bài viết mạnh mẽ hơn, tôi sẽ phân tích các từ khóa chính và phụ giao nhau và tạo một bức tranh về cách người dùng cần được viết và cấu trúc câu trả lời của họ. Trong trường hợp này, tôi sẽ bao gồm một lớp các khu vực và những giống nho chính mà Úc nổi tiếng, sau đó tôi sẽ nói về những loại rượu vang tốt nhất mà Úc có để cung cấp. Xem cách tôi đã kết hợp tốt nhất từ 2 kết quả và đưa vào của tôi? Bây giờ Google có một bài viết mạnh mẽ để lựa chọn khi xem xét những kết quả tốt nhất.” – Jacob Stanley
Như bạn đã thấy, việc triển khai NLP trong SEO có thể mang lại nhiều lợi ích đáng kể. Việc hiểu và tận dụng NLP có thể giúp bạn tối ưu hóa nội dung và cải thiện vị trí của trang web trong kết quả tìm kiếm. Hãy đảm bảo bạn đưa ra nội dung chất lượng và đáp ứng được nhu cầu của người dùng, đồng thời xem xét các yếu tố NLP như tâm trạng, thực thể và tầm quan trọng để đạt được hiệu quả tối đa trong chiến dịch SEO của bạn.
Nguồn tham khảo: https://www.oncrawl.com/technical-seo/nlp-in-seo/