19 Tháng 3, 2023 Việt Anh Trần

Chúng tôi cảm thấy không hài lòng khi gần đây các công cụ tìm kiếm đã không cung cấp được những thứ mà chúng tôi muốn. Tất nhiên, yếu tố yếu kém chính ở đây là tìm kiếm ngữ nghĩa (semantic search) và khả năng vô hạn của nó. Hiện giờ nó đã bước thêm được một bước tiến mới trong việc đưa ra những câu trả lời ngay trong thanh tìm kiếm:

tối ưu hoá tìm kiếm ngữ nghĩa

Bạn nghĩ như thế nào về việc này? Ngay sau đó đoạn trích nổi bật cũng chỉ còn là những di tích trong quá khứ. Hãy cùng Vietads tìm hiểu nhé.

Trong bối cảnh của sự phát triển theo cấp số nhân, tôi quyết định đi sâu tìm hiểu vấn đề này và tìm ra một chiến lược thích hợp để tối ưu hóa tìm kiếm ngữ nghĩa. Vì mục đích của việc nghiên cứu này, tôi chọn Google làm công cụ hỗ trợ và hướng dẫn nghiên cứu tìm kiếm ngữ nghĩa bởi vì tôi chắc chắn rằng nó là lựa chọn tốt nhất trong số các công cụ tìm kiếm ngày nay.

Trước tiên, bạn hiểu tìm kiếm ngữ nghĩa là gì?

Bản chất của tìm kiếm ngữ nghĩa đó là sự nỗ lực của các công cụ tìm kiếm trong việc xử lý ngôn ngữ tự nhiên và hiểu được ý định tìm kiếm của truy vấn thông qua ngữ cảnh để đưa ra những kết quả có liên quan và được cá nhân hóa.

Thông thường, khi nói đến ngữ nghĩa, mọi người thường có xu hướng suy nghĩ về một trường ý nghĩa. Tuy nhiên, có nhiều loại ngữ nghĩa. Hãy cùng nhau phác thảo những thứ quan trọng cho việc nghiên cứu của chúng tôi:

  • Ngữ nghĩa học logic đề cập đến các mối quan hệ giữa các khái niệm/yếu tố ngôn ngữ (tức là tham chiếu, giả định, hàm ý). Riêng trong SEO, nó có thể (và nên được) sử dụng để tạo cấu trúc nội dung. Ví dụ: dữ liệu có cấu trúc đóng vai trò quan trọng đối với ngữ nghĩa logic. Không chỉ có vậy, ngữ nghĩa logic còn được sử dụng để xây dựng trang web; nghĩa là nó được tìm thấy trong HTML và kiến trúc trang web.
  • Ngữ nghĩa học từ vựng liên quan đến ý nghĩa của các từ ngữ và quan hệ của chúng. Trong SEO nó được sử dụng để nghiên cứu từ khóa.

Vậy thì cách thức nó hoạt động như thế nào?

Việc sử dụng các công cụ tìm kiếm để tìm hiểu về tìm kiếm ngữ nghĩa là hoàn toàn dễ hiểu. Trước tiên, nó giúp xử lý ngôn ngữ tự nhiên tốt hơn, ít spam hơn và hiểu rõ hơn mục đích tìm kiếm, từ đó giúp cho trải nghiệm người dùng tốt hơn. Thứ hai, có một thực tế là cứ mỗi 2 năm dữ liệu sẽ tăng lên gấp đôi và đòi hỏi các công cụ tìm kiếm phải có tổ chức, cấu trúc tốt hơn và có sự kết nối những dữ liệu tăng thêm này.

toi uu hoa tim kiem ngu nghia

Toàn bộ vấn đề về tìm kiếm ngữ nghĩa bắt đầu từ bản cập nhật Hummingbird năm 2013 của Google. Thuật toán này sử dụng ngữ cảnh và mục đích tìm kiếm (không phải các từ khóa riêng lẻ trong một truy vấn giống như trước đây) để đảm bảo rằng các trang phù hợp với ý nghĩa tốt hơn là các trang chỉ phù hợp với từ khóa chính xác. Đó là một thay đổi cơ bản trong cách Google truyền tải các kết quả của nó và đảm bảo trải nghiệm tìm kiếm hợp lý.

Sau đó, vào tháng 10 năm 2015, Google đã cho ra mắt RankBrain như một phần của thuật toán Hummingbird. Mặc dù mục đích của nó tương tự như của Hummingbird nhưng cách thức hoạt động của nó thì khác. RankBrain là một hệ thống machine learning (học máy) gồm có 2 phần:

  • Phân tích truy vấn: Nó cố gắng diễn giải các truy vấn bằng cách kết hợp chúng với các truy vấn phổ biến hơn. Quá trình học được kích hoạt khi thuật toán gặp phải các truy vấn dài, hiếm, không rõ ràng hoặc không quen thuộc.
  • Xếp hạng: Để tìm ra sự tương thích với truy vấn, phần này của thuật toán sẽ phân tích các trang đã được lập chỉ mục cho các tính năng cụ thể, ví dụ như các mẫu được sử dụng cho một số cụm từ có liên quan nhất định. Các tính năng cụ thể này được xác định bằng cách phân tích các kết quả tìm kiếm hoạt động tốt nhất (theo CTR, tỷ lệ thoát, thời gian trên trang,…) và tìm kiếm sự tương đồng giữa các trang này. Do đó, những trang có phản hồi tốt ngay cả khi không có chứa các từ khóa chính xác trong truy vấn, đều được cho là có liên quan.

Machine learning với trí tuệ nhân tạo AI

thuật toán máy học

Mọi người thường đánh đồng các thuật ngữ “machine learning” (máy học) và “artificial intelligence (AI)” (trí tuệ nhân tạo). Khi nói về RankBrain, việc sử dụng kết hợp cả 2 khái niệm này là hoàn toàn chính xác. Chúng ta nên hiểu rằng machine learning không tương đương với AI. Để tránh hiểu nhầm, hãy cùng tìm hiểu ý nghĩa của hai thuật ngữ này như thế nào nhé.

  • Machine learning (máy học)  là một lĩnh vực của khoa học máy tính, nó có khả năng tự học hỏi dựa trên dữ liệu đưa vào mà không cần phải được lập trình cụ thể. Nói một cách khác, nó là một hệ thống hoạt động dựa trên toán học để giải quyết vấn đề. Machine learning là một tập con của AI.
  • Trí tuệ nhân tạo (AI) được hỗ trợ bởi machine learning. Nó là một ngành khoa học máy tính liên quan đến việc tạo ra các hệ thống có trí thông minh giống con người và có khả năng tự xử lý thông tin. Có nghĩa là các hệ thống như vậy hoạt động một cách sáng tạo và thường không đoán trước được cũng giống như con người khi đối mặt và tương tác với mọi thứ trong cuộc sống.

Có 3 loại AI:

  1. Artificial Narrow Intelligence (ANI) (Trí tuệ nhân tạo hẹp): Đây là loại AI chỉ tập trung vào một lĩnh vực nhất định bằng cách so sánh với khả năng của con người hoặc vượt ra ngoài nó (ví dụ: loại bỏ thư rác).
  2. Artificial General Intelligence (AGI) (Trí tuệ nhân tạo rộng): Đây là loại AI có thể thực hiện bất kỳ nhiệm vụ trí tuệ nào mà bộ não con người có thể xử lý.
  3. Artificial Superintelligence (ASI) (Trí tuệ siêu nhân tạo): Loại AI này có thể thực hiện bất cứ nhiệm vụ nào vượt quá khả năng của con người.

RankBrain hiện được xếp vào loại ANI. Tuy nhiên, điều này sẽ sớm thay đổi thôi, bởi vì chúng ta đang sống trong một thời đại công nghệ đột phá phát triển. Có nghĩa là để duy trì tính cạnh tranh tối ưu hóa, chúng ta phải nhận thức được tất cả các tiến bộ công nghệ và cố gắng hiểu chúng tốt nhất.

Làm cách nào để tối ưu hóa tìm kiếm ngữ nghĩa?

Làm cách nào để tối ưu hóa tìm kiếm ngữ nghĩa?

Đầu tiên, nếu bạn nghĩ rằng bạn sẽ tối ưu hóa cho RankBrain thì bạn nên biết rằng đó là một việc làm vô ích bởi vì RankBrain hoạt động khi nó gặp các truy vấn không rõ ràng hoặc chưa được biết tới. Để tối ưu hóa cho những truy vấn đó cũng giống như việc bạn đang chiến đấu cho một trận chiến mà nắm chắc phần thua.

Thay vào đó những gì bạn cần làm là tối ưu hóa trải nghiệm người dùng. Tôi nghiên cứu thấy rằng UX (trải nghiệm người dùng) đang dần soán ngôi của nội dung. Tất nhiên, nội dung vẫn còn rất quan trọng, nhưng hiện nay người dùng chính là người cho Google biết nội dung nào mới là tốt.

Và hãy nhớ rằng, hoàn toàn sai lầm khi nghĩ rằng các thuật toán tìm kiếm biết nhiều hơn chúng ta. Khi Google cố gắng giải quyết mục đích tìm kiếm, nó sử dụng cả khối dữ liệu người dùng cuối cùng thu thập trước đó để nắm được những thứ mà người dùng cho là có liên quan. Vì vậy, nó cần dữ liệu để tìm hiểu và dữ liệu để hướng dẫn nó khi nó truy cập vào trang web của bạn.

Hãy xem tiếp theo phải làm gì  để tạo được nội dung chất lượng cao đáp ứng được mục đích người dùng và thân thiện với trình thu thập thông tin của công cụ tìm kiếm.

1. Tạo các thực thể

TL; DR: Các thực thể ngữ nghĩa giúp công cụ tìm kiếm hiểu được ngôn ngữ tự nhiên và giải quyết ý định tìm kiếm. Tìm hiểu cách tạo chúng bằng cách áp dụng dữ liệu có cấu trúc và trở thành thực thể Knowledge Graph.

Bạn biết đấy, chúng ta đang sống trong một thế giới SEO mới và đầy gan dạ. Những gì mà bây giờ tôi đang cố gắng thực hiện là chưa đủ để tìm kiếm từ khóa, mà bạn cần phải tạo ra các thực thể ngữ nghĩa.

Các thực thể ngữ nghĩa có thể là con người, địa điểm hoặc sự vật. Các công cụ tìm kiếm quản lý chúng để giải mã ngôn ngữ tự nhiên bằng cách hiểu được các thực thể ngữ nghĩa, đặc điểm và các mối quan hệ của chúng.

Nhìn chung, các thực thể là trung tâm của quá trình chuyển đổi của Google từ “các chuỗi sang các sự vật sự việc” mà chúng ta đã được thấy với sự ra mắt của Knowledge Graph.

thực thể tìm kiếm ngữ nghĩa

Knowledge Graph (KG) là một trong những bước đi đầu tiên của Google để tìm hiểu cách mà mọi người nhìn nhận thế giới xung quanh. Kết quả mà Google đạt được khi cho ra mắt KG là:

  • Một cơ sở dữ liệu thông tin chung khổng lồ (thủ đô, chiều cao và độ dài, ngày sinh,…).
  • Đặc điểm của từng thực thể (ví dụ: bất kỳ địa điểm nào nằm ở bất cứ vị trí địa lý nào có thể bao gồm các thực thể nhỏ hơn hoặc là một phần của một thực thể lớn hơn,…).

Việc cần làm:

  • Áp dụng dữ liệu có cấu trúc cho trang web của bạn

Để thành công tạo được các thực thể ngữ nghĩa của riêng bạn, bạn cần đảm bảo rằng các công cụ tìm kiếm sẽ lập chỉ mục chính xác và hiểu rõ sự kết nối giữa chúng. Áp dụng dữ liệu có cấu trúc chính là lựa chọn tốt nhất để giúp các công cụ tìm kiếm làm được điều đó.

Một dự án markup dữ liệu có cấu trúc tổng quát – Schema.org – được Google, Bing và Yahoo đưa ra để đơn giản hóa và chuẩn hóa cách mà dữ liệu có cấu trúc được áp dụng trên Web.

Truy cập trang Schema và chọn loại markup phù hợp nhất với thực thể của bạn (địa điểm, con người, doanh nghiệp địa phương, sự kiện, audio, video, hình ảnh,…). Tin vui là bạn có thể thêm schema vào trang web của mình với sự hỗ trợ của Structured Data Markup Helper.

Khi bạn hoàn tất việc thêm markup, bạn có thể sử dụng Structured Data Testing Tool của Google để kiểm tra nó.

Hơn nữa, Schema cũng là một trong những điều kiện tiên quyết giúp cho nội dung của bạn không chỉ xuất hiện trong danh sách các kết quả truy cập tự nhiên mà còn trong cả các đoạn trích chi tiết, nổi bật và bảng kiến thức.

  • Trở thành một thực thể Knowledge Graph (Knowledge Graph entity)

Knowledge Graph không chỉ đề cập đến các bảng ở bên phải SERP. Trên thực tế, nhiều loại SERP được cung cấp bởi cơ sở dữ liệu KG. Một khi bạn có được vị trí trên bất kỳ SERP nào, chắc chắn khả năng hiển thị của bạn sẽ tăng lên.

Trước khi chúng tôi tìm ra cách để làm được điều đó, hãy cùng kiểm tra xem liệu doanh nghiệp của bạn đã có một thực thể nào chưa. Truy cập vào Knowledge Graph Search API, nhập tên thương hiệu/sản phẩm của bạn vào mục Query, và nhấp vào Execute:

Tối ưu thực thể dữ liệu

Kiểm tra kết quả. Dãy itemListElement sẽ bị trống nếu không có thực thể nào. Bạn sẽ thấy một thứ giống như hình minh họa bên dưới nếu có một thực thể KG dành cho thương hiệu của bạn:

Dãy itemListElement

Nếu bạn không hài lòng với dữ liệu đang hiển thị cho thương hiệu của mình (nó được sắp xếp tự động nên có thể dẫn đến một số điểm vô lý), bạn có thể truy cập Wikidata. Sử dụng tìm kiếm để tìm danh sách về công ty của bạn, tại đó bạn có thể chỉnh sửa các chi tiết về doanh nghiệp của mình như mô tả, chi tiết liên hệ, trang web chính thức,…

Hoặc bạn có thể đề xuất thay đổi thực thể KG của mình ngay trong bảng điều khiển KG trong trường hợp bạn đã tìm kiếm tên doanh nghiệp của mình và thấy bảng điều khiển được hiển thị. Chỉ cần nhấp vào tùy chọn Suggest an edit và xác minh bản thân để tiếp tục thực hiện các thay đổi:

chinh sua thuc the doanh nghiep

Nếu doanh nghiệp của bạn vẫn chưa có một thực thể KG, hãy thử làm theo các bước dưới đây. Chúng tôi không nói là sẽ có kết quả ngay lập tức, nhưng chúng sẽ giúp bạn tiến gần hơn với việc trở thành một thực thể:

  • Sử dụng schema markup để tổ chức trang web chính thức của bạn.
  • Sử dụng một loại markup cụ thể cho sản phẩm của bạn (trong danh sách các danh mục sản phẩm).
  • Tạo một mục Wikidata cho doanh nghiệp và sản phẩm của bạn. 
  • Tạo một bài viết trên Wikipedia. Vấn đề là Wikipedia là một trong những nguồn chính cung cấp cho cơ sở dữ liệu KG. Bạn hoàn toàn có thể tự mình làm, tuy nhiên, tốt nhất bạn nên thuê một người biên tập có kinh nghiệm. Hãy đảm bảo trong mục của bạn có chứa một liên kết đến Wikidata.
  • Sở hữu các tài khoản truyền thông xã hội được xác minh bởi các trang mạng xã hội.

Tiếp theo của chủ đề: 4 cách tối ưu hóa tìm kiếm ngữ nghĩa phần 2

Nguồn bài viết: https://www.link-assistant.com/ – Author: Valerie Niechai –  Biên dịch bởi Việt Anh Trần

Việt Anh Trần

Tôi là Việt Anh Trần, người sáng lập tư duy “SEO 3 BƯỚC” và Vietadsonline là đơn vị cung cấp dịch vụ digital marketing, đã và đang chinh chiến hơn 400 dự án seo trong nước và quốc tế với nhiều lĩnh vực khác nhau.

Hiện chúng tôi là công ty cung cấp dịch vụ SEO, thiết kế web, quảng cáo và các mảng đào tạo. Phương châm làm việc của chúng tôi là: “cung cấp khoá học và dịch vụ tốt nhất cho bất kỳ ai”, cảm ơn các bạn đã đọc bài viết của tôi.