Hướng Dẫn Sống Sót – Rémi Bacha

Nếu bạn đã từng nghe về ngôn ngữ R và bạn nghĩ rằng SEO sử dụng nó như một thứ xa xỉ, bạn không hoàn toàn sai.

Ban đầu dành cho các nhà khoa học dữ liệu và nhà thống kê, ngôn ngữ R đã từ một vài năm trở lại đây đến với khán giả không ngờ, và lý do là đơn giản:

Tự động hóa các hành động, lấy dữ liệu thông qua API và tổng hợp chúng, crawl các trang web, liên kết các file khác nhau (ví dụ như từ khóa) hoặc thực hiện khai thác văn bản, học máy, NLP và phân tích ngữ nghĩa, những khả năng mà R và nhiều gói phần mềm của nó mang lại cho SEO là vô số.

Tuy nhiên, hãy làm rõ điều này:

R không phải là một bí mật trong SEO!

Nhưng điều tôi biết sau một vài tháng sử dụng, đó là R đang cách mạng hóa phương pháp tiếp cận SEO bằng cách mang đến những ý tưởng mới và phương pháp làm việc.

Nếu bạn từng mơ ước tạo ra các công cụ SEO riêng của mình hoặc chuyển từ các chiến lược thực nghiệm truyền thống sang SEO dựa trên dữ liệu, bạn đang trên đường trở thành một người ngoài hành tinh của R.

Bắt đầu với R

Tôi bắt đầu sử dụng R từ con số 0 và quyết định nghiên cứu sâu với một khóa học trực tuyến tổng quát trên trang đào tạo trực tuyến nổi tiếng Coursera.org, từ đầu năm 2017.

Tham khảo  Tối ưu các bộ lọc facet cho SEO

Khóa học Data Science của Đại học Johns Hopkins bao gồm nhiều module và có giá là 45€/tháng.

Tôi chủ yếu khuyến nghị các khóa học sau:

  • The Data Scientist’s Toolbox
  • R Programming
  • Getting and Cleaning Data

Sau vài tuần học, với trung bình mỗi ngày một giờ, tôi đã có thể tiết kiệm được một lượng thời gian đáng kể trong các dự án SEO của mình bằng cách tạo ra các kịch bản đầu tiên.

Nhiều công việc SEO thủ công, lặp đi lặp lại và thường tốn thời gian ngày càng được thay thế bằng các kịch bản R.

Bạn có quan tâm đến cách làm SEO mới này không? Ở đây bạn sẽ tìm thấy tất cả những gì bạn cần để bắt đầu: tài nguyên, dòng lệnh hữu ích (được sử dụng như một “R cheat sheet”), một số kịch bản R mà bạn có thể sử dụng cho dự án của bạn và các hướng dẫn R cho SEO.

Bắt đầu với R

Nếu bạn muốn tăng tốc quá trình học Khoa học Dữ liệu cho dự án SEO của bạn, tôi mời bạn đăng ký khóa đào tạo Data Science SEO tiếp theo. Xin lưu ý rằng không cần kiến thức kỹ thuật để tham gia khóa đào tạo này.

Nơi sử dụng R?

Bắt đầu với:

  • Tải xuống R
  • Cài đặt phần mềm R Studio mã nguồn mở và miễn phí.

Tổng quan về giao diện R Studio với một kịch bản cho phép bạn lấy dữ liệu từ SEMrush

Sau khi cài đặt R Studio, bạn có thể thử nghiệm các kịch bản R sau trực tiếp trong console (phần dưới bên trái) hoặc sao chép và dán chúng vào một kịch bản mới: File > New File > R Script

Các chức năng cơ bản

Các gói R

R có rất nhiều gói phần mềm (= “các chức năng” để tải xuống). Bạn sẽ tìm thấy danh sách trên trang web cran-r.

Dưới đây là một số gói R mà bạn sẽ sử dụng nhiều nhất cho SEO:

Tham khảo  Tìm hiểu về Search Intent: Hướng dẫn đầy đủ

  • dplyr: Xử lý dữ liệu từ dataframe (lọc, sắp xếp, chọn, tóm tắt, v.v.)
  • SEMrushR (tiếng Pháp): Sử dụng SEMrush API (gói phần mềm chính thức đầu tiên của tôi, trên CRAN!)
  • majesticR (tiếng Pháp): Sử dụng Majestic API (gói phần mềm chính thức thứ hai của tôi)
  • kwClustersR: Gom nhóm danh sách từ khóa
  • duplicateContentR (tiếng Pháp): Tính điểm tương đồng giữa 2 trang để phát hiện nội dung trùng lặp
  • text2vec: Trích xuất n-grams
  • eVenn: Tạo biểu đồ Venn (hữu ích cho kiểm tra ngữ nghĩa)
  • tm: Xử lý dấu thanh và từ dừng
  • ggplot: Tạo đồ thị
  • shiny: Tạo ứng dụng thực tế dựa trên kịch bản của bạn
  • searchConsoleR (tiếng Pháp): Sử dụng Google Search Console API
  • httr: Thực hiện GET, POST, PUT, DELETE
  • Rcurl: Cũng để thực hiện các yêu cầu, đầy đủ hơn so với httr
  • XML: Phân tích trang web
  • jsonlite: Truy xuất json
  • googleAuthR: Quản lý xác thực cho Google
  • googleAnalyticsR: Làm việc với Google Analytics API
  • searchConsoleR: Tải xuống dữ liệu Search Console vào R
  • urltools: Thực hiện xử lý URL

Xử lý khối lượng dữ liệu lớn

Sử dụng dữ liệu là một phần không thể thiếu trong bất kỳ dự án SEO nào: dữ liệu từ Screaming Frog, SEMrush, Search Console, công cụ phân tích web của bạn hoặc các nguồn khác. Chúng có thể được lấy trực tiếp từ các API hoặc từ xuất khẩu thủ công.

Ở các phần tiếp theo, bạn sẽ tìm thấy mẹo về cách xử lý các bộ dữ liệu này.

Mở và lưu trữ bộ dữ liệu

Hiểu rõ hơn về bộ dữ liệu của bạn

Tập trung vào gói DPLYR

DPLYR là gói phần mềm BẠN cần phải biết. Nhờ nó, bạn có thể thực hiện nhiều quy trình trên bộ dữ liệu của bạn: lựa chọn, lọc, sắp xếp, phân loại, v.v.

Các xử lý khác cần biết

Dưới đây là một số lệnh mà tôi thường sử dụng để thực hiện các hoạt động trên các bộ dữ liệu lớn của từ khóa, chẳng hạn như xuất khẩu từ SEMrush, Ranxplorer hoặc Screaming Frog.

Tham khảo  Tìm hiểu về công cụ tìm kiếm - Định nghĩa, ý nghĩa và ví dụ

Các hoạt động này giúp tôi tăng tốc quá trình tìm kiếm cơ hội SEO. Ví dụ, bạn có thể phân loại các từ khóa thành các chủ đề, loại bỏ các từ khóa trùng lặp sau khi kết hợp từ nhiều danh sách, xóa các ô trống và chia các bộ dữ liệu của tôi thành nhiều bộ nhỏ, mỗi bộ tương ứng với một chủ đề con để khai thác.

Đối với xuất khẩu từ Screaming Frog, bạn sẽ tìm thấy ở đây một số lệnh để đếm các yếu tố như số URL đã crawl, số ô trống trong một cột và số URL cho mỗi mã trạng thái.

Web Scrapping và Trích xuất Nội dung

Tạo một trình thu thập thông tin rất hữu ích để nhanh chóng lấy các yếu tố cụ thể trên một trang web. Điều này sẽ được sử dụng, ví dụ, để theo dõi sự phát triển của một trang web đối thủ: chiến lược giá, cập nhật nội dung, v.v.

Scraper XML

Với kịch bản sau, bạn có thể tải xuống một tệp XML, phân tích nó và lấy ra một số biến quan tâm. Bạn cũng sẽ thấy cách chuyển đổi nó thành dataframe.

Scraper HTML

Lấy liên kết từ một trang, lấy danh sách các bài viết, đây là một số ví dụ về những gì bạn có thể làm với kịch bản sau.

JSON Scraper

Tôi hy vọng những vài ví dụ về việc sử dụng R để xử lý dữ liệu SEO của bạn đã khiến bạn muốn đi sâu hơn! Vui lòng chia sẻ bài viết này trên mạng xã hội của bạn nếu bạn thích nó.

Các hướng dẫn SEO tốt nhất với R

Sắp ra mắt. Theo dõi tôi trên Twitter để được thông báo về cập nhật tiếp theo của bài viết này:

Theo dõi @Remibacha

Yêu thích SEO và Khoa học Dữ liệu. Sáng lập LABS ON MARS và đồng sáng lập các khóa đào tạo DATA SCIENCE SEO.

Tìm hiểu thêm về chúng tôi tại: TRANHUNG Digital

Đánh giá bài viết
Contact Me on Zalo