19 Tháng 3, 2023 Việt Anh Trần

Để quản lí một hệ thống có hiệu quả, bạn phải tập trung vào sự tương tác giữa các bộ phận thay vì hướng vào các hành vi riêng lẻ của từng bộ phận đó. Chắc các bạn cũng đã từng nghe và biết về thuật ngữ trong SEO là dữ liệu có cấu trúc (Structured Data) và web ngữ nghĩa (Semantic Web), trong bài viết này Vietads online sẽ giải thích và hướng dẫn cho các bạn mới bắt đầu.

dữ liệu có cấu trúc

Người nói tiếng anh có thể hiểu nghĩa của “giraffelivesinsavannah” là gì. Họ có thể tách các chữ cái thành câu có nghĩa “hươu cao cổ sống trên đồng cỏ” và họ có được tập hợp những từ riêng lẻ. Một “con hươu cao cổ” là loại động vật cao với cái cổ thật sự dài, 4 chân dài và có một bộ lông đặc biệt. Nó “sống” (nghĩa là nó cư ngụ ở một địa điểm xác định) trên “đồng cỏ”. Chúng ta có thể không biết chính xác “savannah” là gì nhưng chúng có thể định hình rằng nó là một địa điểm nào đó. Vì chúng ta thường sống ở một “địa điểm” nào đó, đúng không?

Những con bọ tìm kiếm thì không thông minh như thế. Khi nó gặp phải cụm từ “giraffelivesinsavannah” nó sẽ lưu cả 22 ký tự Latin vào bộ nhớ và tìm các mẩu thông tin mới để sử dụng. Không có từ vựng được tải trước và một bộ các qui tắc đặc biệt (hoặc nếu tôi quen sử dụng ngôn ngữ thông dụng mà không có “dữ liệu có cấu trúc”, thì chương trình máy tính không thể truy xuất được ý nghĩa của một chuỗi các ký tự. Khi ai đó tìm kiếm trang web với cụm “giraffelivesinsavannah”, máy tính kiếm sẽ nhanh chóng phản hồi trang web có chứa chuỗi ký tự này. Nhưng nếu bạn tìm kiếm cụm từ “where do giraffes live” máy tìm kiếm sẽ không hiển thị cho bạn trang web đó mặc dù trang đó có chứa câu trả lời cho truy vấn.

Điều đó có nghĩa là bạn không thể hi vọng máy tìm kiếm hiểu ngôn ngữ như con người. Nhưng là một SEOer, nhiệm vụ và sự quan tâm nhất của bạn chính là giúp máy tìm kiếm hiểu được. Và đó chính là vấn đề liên quan tới dữ liệu có cấu trúc.

Từ bài viết blog này, bạn sẽ biết cách làm thế nào để có thêm lưu lượng truy cập và hiển thị trong kết quả tìm kiếm bằng cách hỗ trợ máy tìm kiếm hiểu được website của bạn tốt hơn.

Web ngữ nghĩa và dữ liệu có cấu trúc

Các nhà quảng cáo online thích cường điệu những từ ưa thích. Web ngữ nghĩa và tìm kiếm theo ngữ nghĩa là một trong những trải nghiệm tốt. Gần như chỉ có một cuộc gặp hoặc 1 hội thảo vào năm 2017 là không đề cập tới nó. Nhưng có lẽ bạn sẽ ngạc nhiên để biết rằng. web ngữ nghĩa đã được nhắc tới từ năm 1998.

Giờ thì bỏ qua những thứ liên quan tới marketing và tìm hiểu xem web ngữ nghĩa là cái gì?. Ngữ nghĩa là việc nghiên cứu ý nghĩa của ngôn ngữ. Cụ thể, nó nghiên cứu mối quan hệ giữa các kí tự (từ, cụm từ và kí hiệu) và cái mà những kí tự này đại diện hay chính là nghĩa của các kí tự đó. Vì thế, web ngữ nghĩa là web có ý nghĩa. Web ngữ nghĩa không phải là các từ khóa và backlink, nó là những mối quan hệ giữa những khái niệm. Thay vì nhìn vào chuỗi kí tự thì sẽ nhìn vào khái niệm và tính chất phía sau nó.

Có những từ vựng và ngữ pháp dành cho web ngữ nghĩa khá giống với ngôn ngữ của con người. Bạn có thể sử dụng chúng để tạo nên các câu lệnh logic trên site của mình và bots của máy tìm kiếm có thể thu thập, phân tích và xử lý chúng. Điều khiến tìm kiếm theo ngữ nghĩa khác với các dạng tìm kiếm thông thường khác là những quy tắc logic được áp dụng vào thông tin. Nếu một máy tìm kiếm tìm thấy một thông tin logic trên website của Barack “Barack là một người bạn đối với Michelle”, và ai đó thực hiện tìm kiếm “bạn của Michelle” thì nếu web của Michell không đề cập tới Barack (thậm chí site của Michelle còn chẳng tồn tại) thì máy tìm kiếm ngữ nghĩa sẽ cho chúng ta biết Barack tự xem mình là bạn của Michelle.

Từ ví dụ trên, chúng ta thấy rằng máy tìm kiếm có thể lấy kiến thức từ dữ liệu ở cấp độ cao. Chúng ta có thể gọi nó là dữ liệu có cấu trúc và có ý nghĩa.

Tại sao lại sử dụng dữ liệu được cấu trúc trên site của bạn?

Qua nhiều năm, các trang kết quả tìm kiếm (tôi đang nói tới Google nhé) đã thay đổi, phát triển từ một danh sách những dòng thông tin được hyperlink link màu xanh….

web ngữ nghĩa

… để trở thành một trang thông tin với nhiều thông tin hữu ích. Thực tế, SERP tự nó có thể đáp ứng yêu cầu của người dùng mà không phải click vào một kết quả tìm kiếm thực tế.

dữ liệu có cấu trúc là gì

Có những tiện ích và thẻ được gọi là tính năng tìm kiếm. Có hai tính năng tìm kiếm:

  • Tính năng về loại nội dung được hiển thị như là các kết quả riêng rẽ. Thường nó bao gồm các câu trả lời trực tiếp, các panel của biểu đồ tri thức hoặc các thông tin dạng băng chuyền.
  • Nâng cao kết quả tìm kiếm, là một phần của các trích dẫn kết quả tìm kiếm thực tế, ví như các đường link phân cấp hoặc được xếp hạng.

Tính năng tìm kiếm thu hẹp khoảng trống trên SERP, và để đẩy lên đầu, site phải có tỉ lệ nhấp vào trang cao. Từ cái tôi quan sát được thì các trích dẫn nâng cao làm tăng 30% tỉ lệ nhấp trên trang so với đối tác của họ. Nếu site của bạn không tận dụng được những tính năng tìm kiếm, thì bạn có thể bỏ lỡ cả 2 lần hiển thị bổ sung ấn tượng, ví như các câu trả lời trực tiếp hoặc các nội dung hiển thị top đầu và số lần nhấp trang.

Thêm nữa, dữ liệu có cấu trúc mở ra một ra thế giới mới về chức năng người dùng. Người dùng có thể chuyển đổi dữ liệu được cấu trúc giữa các ứng dụng và website. Nếu site sử dụng dữ liệu được cấu trúc, trình duyệt web có thể mang lại trải nghiệm người dùng nâng cao. Ví dụ, một sự kiện trên một website có thể được tích hợp trực tiếp vào lịch trên máy tính của người dùng, người dùng có thể đặt vé xem phim hoặc hòa nhạc từ chính trang kết quả tìm kiếm và tìm thấy số điện thoại của nhà hàng gần nhất cho bữa tối.

Bài viết tham khảo: Tối ưu hoá tìm kiếm cho SEO Voice search (SEO bằng giọng nói) 2018

Các tính năng tìm kiếm là một phần của web ngữ nghĩa và chúng dựa trên dữ liệu được cấu trúc mà Google có thể hiểu và diễn giải. Google có thể bật nhiều tính năng cho trang web của bạn trong kết quả tìm kiếm nếu nó hiểu nội dung của trang, và nếu bạn cung cấp các thông tin bổ sung vào mã của trang với sự trợ giúp của dữ liệu được cấu trúc (structured data).

Tôi hi vọng Vietads có thể thuyết phục bạn hiểu rằng đánh dấu dữ liệu có cấu trúc không còn là một tùy chọn nữa. Giờ thì cùng nhau tìm hiểu sâu hơn các chi tiết mang tính kĩ thuật nhé.

Schema.org, Microdata, Microformats, hay RDFa?

Mọi người chưa có thống nhất đâu là cách tốt nhất để đánh dấu dữ liệu có cấu trúc. Thế nên là có cả loạt những thuật ngữ khó hiểu sinh ra như RDF, RDFa, Microformats, Microdata, Schema … Tôi sẽ cố gắng giải thích bằng thứ tiếng anh đơn giản và chúng ta sẽ tìm ra và lựa chọn cái nào là tốt nhất cho SEO.

Về cơ bản, nếu bạn muốn chuyền tải thông tin, dù là ngôn ngữ tự nhiên hay ngôn ngữ của máy tính thì bạn cũng cần tới 2 thứ sau:

  • Từ vựng: một nhóm các từ đại diện cho các cặp kí hiệu.
  • Ngữ pháp: tập hợp của những nguyên tắc để làm sao sử dụng từ vựng cho mục đích chuyển tải ý nghĩa.

Dưới đây là một ví dụ từ vựng đơn giản cho đánh dấu dữ liệu được cấu trúc. Nó bao gồm 5 đường dẫn

  • Con người – một con người (còn sống, đã chết hoặc hư cấu). Con người có thể được mô tả bằng những thông tin sau:

Họ – họ của một người theo gia đình

  • Tên chính
  • Giới tính
  • Ngày sinh

Và chúng ta cần một vài nguyên tắc ngữ pháp mà chúng ta phải sử dụng để chương trình của máy tính có thể hiểu và lưu trữ dữ liệu. Ví dụ:

  • Đặt dữ liệu được cấu trúc trong ngoặc nhọn
  • Tách các thông tin và giá trị của nó bằng dấu : và đặt nó trong dấu ngoặc kép.
  • Tách các cặp giá trị bằng dấu phẩy

{
“type”: “Person”,
“givenName”: “Barack”,
“gender”:”Male”
}

Không đưa vào các thông tin không cần thiết, hầu hết các thuật ngữ liên quan tới việc đánh dấu dữ liệu có cấu trúc có thể được chia thành 2 nhóm – từ vựng và cú pháp. Ngoại trừ Microformats, bạn có thể kết hợp ngữ pháp và từ vựng tùy ý sao cho phù hợp với yêu cầu của bạn. Theo các liên kết nếu bạn đang tìm kiếm thông tin cụ thể về bất kì điều gì.

Vocabularies Grammars

Chú ý 1: Micoformat sử dụng cả cú pháp cho việc nhúng vào các dữ liệu được cấu trúc trong HTML cũng như sử dụng từ vựng cho các thuật ngữ cụ thể. Đó là lí do tại sao tôi đưa nó vào cả 2 cột trong bảng trên. Với Microformat bạn có thể chỉ đánh dấu nội dung nếu cộng đồng Microformat tạo ra và chấp nhận một từ vựng thích hợp. Đây là một nhược điểm lớn của định dạng này. Trái lại, bạn có sử dụng bất kì từ vựng nào, thậm chí là của chính bạn với RDFa, Microdata và JSON-LD.

Chú ý 2: Twitter và Facebook khuyến khích các nhà quản trị web sử dụng đánh dấu dữ liệu của chính họ. Đó là những thẻ TwitterOpen Graph protocol. Các định dạng này không dành cho các máy tìm kiếm, vì thế tôi không nhắc tới trong bài viết này. Cả thẻ Twitter và Open Grahp có thể cùng tồn tại với các dạng đánh dấu khác. Bật thẻ Twitter trên trang web của bạn, người dùng khi liên két trên Twitter tới nội dung của bạn sẽ có một “thẻ” được thêm vào đoạn tweet hiển thị với người theo dõi. “Thẻ” có thể được chuẩn bị sẵn với hình ảnh, video, hoặc văn bản cho bạn lựa chọn. Open Graph cho phép bất kỳ trang web nào trở thành một đối tượng trong biểu đồ xã hội, và nó được sử dụng trên Facebook để cho phép bất kỳ trang web nào có chức năng giống như bất kỳ đối tượng nào khác trên Facebook.

Bạn nên sử dụng từ vựng và ngữ pháp nào trên site của bạn?

Schema.org nên là lựa chọn từ vựng cho bạn, Nó được sử dụng bởi các máy tìm kiếm lớn như Google, Bing, Yahoo và Yandex. Schema.org được tài liệu hóa, linh hoạt và phát triển không ngừng.

Còn về ngữ pháp, không có câu trả lời ngắn gọn cho vấn đề này. Có 3 giao thức chính về ngữ pháp: RDFa, Microdata và JSON-LD. RDFa và Microdata khá giống nhau. Cả hai đều cho phép một người dùng sử dụng lại dữ liệu HTML hiển thị.

Trong việc triển khai RDFa (xem bên dưới), không có sự trùng lặp về nội dung của “startDate”, ‘endDate” và các giá trị đánh dấu khác hiển thị với người dùng:

<div vocab=”http://schema.org/” typeof=”SportsTeam”>
<span property=”name”>San Francisco 49ers</span>
<div property=”member” typeof=”OrganizationRole”>
<div property=”member” typeof=”http://schema.org/Person”>
<span property=”name”>Joe Montana</span>
</div>
<span property=”startDate”>1979</span>
<span property=”endDate”>1992</span>
<span property=”roleName”>Quarterback</span>
</div>

Ngược lại, JSON-LD có trùng lặp dữ liệu được chèn vào thẻ <head> hoặc <body> của một trang như là một <script>

<script type=”application/ld+json”>
{
“@context”: “http://schema.org”,
“@type”: “SportsTeam”,
“name”: “San Francisco 49ers”,
“member”: {
“@type”: “OrganizationRole”,
“member”: {
“@type”: “Person”,
“name”: “Joe Montana”
},
“startDate”: “1979”,
“endDate”: “1992”,
“roleName”: “Quarterback”
}
}
</script>

Đây chính là sự khác biệt cốt lõi từ quan điểm của một nhà quảng cáo hoặc một SEOer.

Theo Web Data Commons (nhìn vào biểu đồ dưới đây), Microdata được sử dụng phổ biến nhất, tiếp sau đó là JSON-LD và JSON-LD vẫn đang tiếp tục được sử dụng rộng rãi. Hiện tại, Google khuyến khích bạn mã hóa dữ liệu với JSON-LD mặc dù máy tìm kiếm cũng có thể phân tích cú pháp của Microdata và RDFa.

Theo ý kiến của tôi Schema.org + JSON-LD là tốt nhất cho các chủ trang web.

dữ liệu có cấu trúc

Làm thế nào để thực hiện đánh dấu dữ liệu có cấu trúc?

Cuối cùng tới lúc chúng ta sẵn sàng đưa lý thuyết vào thực tế. Bạn chỉ cần 4 bước để đánh dấu dữ liệu có cấu trúc.

1. Chọn sơ đồ  

Nghiên cứu cẩn thận các sơ đồ có trong Schema.org. Có các dạng sơ đồ phổ biến sau:

  • Tổ chức
  • Con người
  • Địa điểm
  • Doanh nghiệp địa phương
  • Nhà hàng
  • Sản phẩm
  • Đề xuất
  • Đánh giá
  • Công việc sáng tạo
  • Sách
  • Phim ảnh
  • Thu âm ca nhạc
  • Công thức nấu ăn
  • Series truyền hình
  • Sự kiện

Tạo bản đồ của các sơ đồ cho website của bạn trong một spreadsheet. Lập danh sách các URL cửa từng trang hoặc danh mục trang web trong một cột và các sơ đồ liên quan trong cột còn lại.

URLs Schemas
  • http://my-dance-school.com/about
  • http://my-dance-school.com/the-team
  • http://my-dance-school.com/training-videos
  • http://my-dance-school.com/testimonials
  • http://my-dance-school.com/calendar
  • Organization, Local Business
  • Person
  • Creative Work
  • Review
  • Event

Chú ý: Nhiều sơ đồ có thể kết hợp để miêu tả cùng một đối tượng. Ví dụ, Con gười là một sơ đồ phù hợp để miêu ta một John Smith. Nhưng sơ đồ này cũng có thể có một Địa chỉ và được kết nối với một Tổ chức có thể có một Địa chỉ. Con người, Địa chỉ và Tổ chức là 3 sơ đồ khác nhau và chúng ta sử dụng chúng để miêu tả về chỉ một John Smith.

Khi hoàn thành bản đồ cho các sơ đồ, bạn có thể chuyển qua bước tiếp theo.

2. Thực hiện đánh dấu các dữ liệu được cấu trúc

Nhờ có Google, bạn không cần phải là một nhà phát triển web nếu bạn cần đánh dấu dữ liệu có cấu trúc trên một website. Bạn có thể sử dụng Structured Data Markup Helper. Đây là một công cụ dễ sử dụng hướng dẫn cho bạn thực hiện toàn bộ quá trình.

1) Mở Structured Data Markup Helper, chọn sơ đồ liên quan và nhập một URL từ spreadsheet mà bạn đã tạo trước đó. Sau đó click vào Start Tagging.

danh dau du lieu co cau truc

2) Đánh dấu các phần tử của trang và gán các thẻ sơ đồ cho chúng. Bạn có thể thêm vào các thẻ bị thiếu nếu không đại diện hiển thị thông tin. Chỉ cần click vào Add missing tags, tiếp đó click Create HTML, mọi thứ đã sẵn sàng.

danh dau du lieu co cau truc

3) Chọn JSON_LD từ menu thả xuống. Sao chép mac và dán nó vào thẻ <head> hoặc <body> trong HTML của trang tương ứng trên site của bạn.

danh dau du lieu co cau truc

Chú ý: Nếu site của bạn có hàng ngàn trang có thể sử dụng dữ liệu được cấu trúc, thì nhiệm vụ này nên giao cho đội phát triển web sẽ có hiệu quả hơn.

3. Kiểm tra đánh dấu.

Vào Structured Data Testing Tool và nhập URL của trang bạn muốn kiểm tra. Công cụ này sẽ hiển thị các dữ liệu được đánh dấu và cung cấp thông tin về các lỗi và cảnh báo

danh dau du lieu co cau truc

Giờ là lúc ngồi lại và thư giãn. Các trích dẫn sẽ không được hiển thị trên kết quả tìm kiếm trước khi Google thu thập lại trang web. Hãy nhớ rằng, không có sự đảm bảo cho dữ liệu được cấu trúc của bạn sẽ hiển thị trong kết quả tìm kiếm thậm chí là khi dữ liệu đó được đánh dấu và có thể được trích xuất thành công theo công cụ kiểm tra. Nguyên nhân phổ biến là do:

  • Dữ liệu được cấu trúc không đại diện cho nội dung chính trên trang hoặc cố thể gây hiểu lầm.
  • Dữ liệu được cấu trúc, theo cách nào đó là không chính xác nhưng công cụ kiểm tra không thể nắm bắt được.
  • Nội dung được đánh dấu bị ẩn với người dùng.

Để đơn giản việc này, đừng có gắng đánh lừa Google. Trường hợp tồi tệ nhất là trang web của bạn có thể sẽ bị phạt nếu không sử dụng đúng dữ liệu có cấu trúc. Có những trường hợp, Google áp dụng tác vụ thủ công đối với các website. Thông báo về hình phạt thường như thế này:

“Việc đánh dấu trên một số trang của site dường như sử dụng kĩ thuật như đánh dấu nội dung không hiển thị với người dùng, đánh dấu nội dung không liên quan hoặc thông tin sai lệch, và/hoặc hành vi vi phạm vào những nguyên tắc về chất lượng của trích dẫn của Google”.

Hoặc nó sẽ giống thế này:

danh dau du lieu co cau truc

Bạn vừa được cảnh báo. Để biết thêm kinh nghiệm và nhận các lời khuyên, hãy đọc Hướng dẫn về dữ liệu có cấu trúc của Google.

4. Sử dụng công cụ dữ liệu có cấu trúc để xác định vấn đề

Theo luật của Murphy thì “mọi thứ sẽ đi sai hướng nếu bạn cho nó cơ hội” . Developer có thể tạo ra các bug hoặc những người quản lí marketing mới có thể thêm những dữ liệu có cấu trúc bị lỗi vào trong trang.

Kiểm tra dữ liệu có cấu trúc như là một phần thói quen SEO của bạn. Đăng nhập vào Google Search Console. Click vào Search Appearance > Structured Data. Bạn sẽ không chỉ nhận được chi tiết về các lỗi mà nó còn đánh dấu các thông tin cụ thể về loại cấu trúc được phát hiện trên trang của bạn.

DỮ LIỆU CÓ CẤU TRÚC

Nếu bạn tìm kiếm một công cụ cấp ngành để quản lý dữ liệu có cấu trúc, hãy xem qua Anything to Triples (Any23). Bạn có thể sử dụng nó để:

  • Xác nhận dữ liệu có cấu trúc.
  • Trích xuất dữ liệu có cấu trúc và.
  • Chuyển đổi định dạng dữ liệu có cấu trúc.

Kết luận:

“Web ngữ nghĩa” là một thuật ngữ cũ xuất hiện từ những năm 90. Nó được sử dụng để biểu thị cho một trang web có ý nghĩa, mà ở đó các mối quan hệ thực sự giữa thông tin trên web quan trọng hơn là các keyword và các liên kết href. Máy tìm kiếm dễ dàng hơn để hiểu ý nghĩa của dữ liệu khi nó có cấu trúc. Những trải nghiệm tìm kiếm mới, ví như Recipes hay các panel của Biểu đồ tri thức dựa trên dữ liệu có cấu trúc. Bạn có thể triển khai dữ liệu có cấu trúc với sự trợ giúp của Schema.org và các cú pháp của JSON-LD. Cách dễ nhất để tạo đánh dấu cho từng trang là sử dụng công cụ Structure Data Testing của Google.

Giờ thì bạn đã có đủ các công cụ và kiến thức cần thiết để site của bạn trở thành web ngữ nghĩa. Và nếu bạn có bất kì câu hỏi hay phản hồi nào, hãy cho Vietads biết ở phần bình luận nhé, nếu thấy bài viết hay hãy chi sẻ ngay dừng ngại ngần nhé. Tham khảo thêm các bài viết bổ ích tại: Kiến thức SEO 2018

Có thể bạn quan tâm: Dịch vụ SEO websiteCông ty thiết kế websiteDịch vụ chạy quảng cáoDịch vụ xây dựng vệ tinhDịch vụ backlink giá rẻDịch vụ cloud vps.

Nếu copy về website vui lòng dẫn nguồn http://vietadsonline.com/ để thể hiện sự tôn trọng chất xám của người khác, xin cảm ơn.

Nguồn tại: https://www.link-assistant.com/ – author: Yauhen Khutarniuk  Edit by: Việt anh trần

Việt Anh Trần

Tôi là Việt Anh Trần, người sáng lập tư duy “SEO 3 BƯỚC” và Vietadsonline là đơn vị cung cấp dịch vụ digital marketing, đã và đang chinh chiến hơn 400 dự án seo trong nước và quốc tế với nhiều lĩnh vực khác nhau.

Hiện chúng tôi là công ty cung cấp dịch vụ SEO, thiết kế web, quảng cáo và các mảng đào tạo. Phương châm làm việc của chúng tôi là: “cung cấp khoá học và dịch vụ tốt nhất cho bất kỳ ai”, cảm ơn các bạn đã đọc bài viết của tôi.