Monday, March 2, 2020

Cách tùy chỉnh tệp Robots.Txt Blogger 2021

Bạn muốn tìm hiểu cách thêm tệp robot.txt tùy chỉnh trong blogger vào năm 2021? CÓ, sau đó chúc mừng bạn nhập đúng bài viết. Đây là bài viết cho bạn.
Trong bài đăng này, tôi đang chia sẻ các cách để thêm tệp robot.txt tùy chỉnh trong blogspot blogger vào năm 2021. Trước khi chúng tôi đi sâu vào, tôi thực sự muốn nói về tệp robot.txt là gì và tại sao bạn nên thêm tệp robot.txt tùy chỉnh tập tin trong blogger.

Tập tin Robots.Txt tùy chỉnh là gì?

Robots.txt là một tệp văn bản của Google bao gồm một vài dòng mã đơn giản. Nó được lưu trữ trên trang web hoặc máy chủ của trang web hướng dẫn các trình thu thập dữ liệu web về cách lập chỉ mục và thu thập dữ liệu trang web của bạn trong kết quả tìm kiếm của Google.

Tại sao bạn nên thêm tệp Robots.txt tùy chỉnh trong Blogger?

Bằng Cách tùy chỉnh tệp Robots.Txt  Blogger  2020, bạn có thể hạn chế bất kỳ trang web nào trên trang web của mình khỏi trình thu thập dữ liệu web để nó không thể được lập chỉ mục trong các công cụ tìm kiếm như trang web thẻ blog, trang demo của bạn hoặc bất kỳ trang nào khác phát sinh Điều quan trọng là được lập chỉ mục. Nó rất thuận lợi cho SEO giúp bạn tăng lưu lượng truy cập không phải trả tiền.
Cách tùy chỉnh tệp Robots.Txt  Blogger 2020

Luôn nhớ rằng trình thu thập tìm kiếm tìm kiếm tệp robot.txt trước khi thu thập bất kỳ trang web nào. Mỗi trang web được lưu trữ trong blogger có tệp robot.txt tùy chỉnh mặc định riêng.
Kiểu 1
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Disallow: /b
Allow: /
Sitemap: https://www.youblogurll.blogspot.com/sitemap.xml
Kiểu 2
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Disallow: /b
Allow: /
Sitemap: https://www.yourblogurll.blogspot.com/sitemap.xml

Làm cách nào để thêm tệp Robots.Txt tùy chỉnh trong Blogspot?

Áp dụng các cách sau để thêm tệp robot.txt tùy chỉnh trong blogspot blogger vào năm 2020.
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Disallow: /b
Allow: /
Sitemap: https://www.yourblogurll.blogspot.com/feeds/posts/default?orderby=updated
Bước 1 - Chuyển đến blog blogger của bạn.
Bước 2 - Điều hướng đến Cài đặt Tùy chọn Tìm kiếm Bộ thu thập dữ liệu và lập chỉ mục Cách thức Tùy chỉnh robot.txt
Bước 3 - Bây giờ kích hoạt nội dung robot.txt tùy chỉnh bằng cách chọn Có Có.
Bước 4 - Bây giờ dán mã tệp tệp robots.txt của bạn vào Hộp đã cho.
Bước 5- Nhấp vào nút Lưu Thay đổi.
Bước 6- Bây giờ bạn đã hoàn tất!

Tất cả về Robot.txt tùy chỉnh

Mỗi trang web được lưu trữ trong blogger có tệp robot.txt tùy chỉnh mặc định của riêng mình mà một thứ gì đó trông giống như thế:
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Disallow: /b
Allow: /
Sitemap: https://www.yourblogurll.blogspot.com/feeds/posts/default?orderby=updated

Tìm hiểu về  Robot.txt :

Mã này đã được chia thành các phân khúc khác nhau. Trước tiên chúng ta hãy nghiên cứu từng người trong số họ sau đó chúng ta sẽ tìm hiểu cách khám phá các tệp robot.txt tùy chỉnh trong các trang web blogger.

  • User-agent: Mediapartners-Google

Mã này dành cho các robot Google Adsense giúp họ phân phát quảng cáo ưu việt trên blog của bạn. Bạn có thể sử dụng Google Adsense trên blog của mình hoặc không đơn giản là từ bỏ nó như thực tế.

  • User-agent:*

Theo mặc định, các siêu liên kết thẻ blog của chúng tôi bị giới hạn bởi các trình thu thập tìm kiếm có nghĩa là người quản trị trang web đã giành được chỉ số siêu liên kết trang thẻ của chúng tôi vì mã bên dưới.

  • Disallow: /search

Điều đó có nghĩa là các siêu liên kết có tra cứu từ khóa chỉ sau khi tên miền sẽ bị bỏ qua. Xem ví dụ bên dưới rằng một liên kết của trang thẻ được gọi là SEO.
Và nếu chúng tôi loại bỏ Disallow: / search trong đoạn mã trên thì trình thu thập thông tin có thể lấy toàn bộ blog của chúng tôi để lập chỉ mục và thu thập tất cả các bài viết và trang web của nó

  • Here Allow: 

 mô tả Trang chủ có nghĩa là trình thu thập dữ liệu internet có thể thu thập dữ liệu và lập chỉ mục trang chủ blog của chúng tôi.

  • Disallow Particular Post

Bây giờ giả sử nếu chúng ta muốn loại trừ một bài viết cụ thể khỏi việc lập chỉ mục thì chúng ta có thể đặt các dòng dưới đây từ mã.

  • Disallow: /yyyy/mm/post-url.html
Ở đây yyyy và mm này biểu thị tháng xuất bản và năm của bài đăng tương ứng. Chẳng hạn, nếu chúng tôi công bố một bài đăng vào năm 2013 mỗi tháng của tháng 3 thì chúng tôi phải sử dụng định dạng dưới đây.
Điều đó có nghĩa là nếu trình thu thập thông tin thu thập dữ liệu tệp robots.txt của bạn thì họ cũng có thể tìm thấy tuyến đường để thu thập dữ liệu trang web của trang web của bạn.

Nếu bạn bao gồm sơ đồ trang web của bạn trong tài liệu robot.txt thì trình thu thập dữ liệu mạng sẽ dễ dàng thu thập dữ liệu tất cả các trang và bài viết mà không bỏ lỡ.
Lưu ý: Trang web này sẽ chỉ tiết lộ trình thu thập thông tin của 25 bài viết và Quản trị viên web gần đây sẽ thu thập dữ liệu 25 bài đăng hiện tại nhưng nếu bạn cần trình duyệt web để thu thập 500 bài đăng gần đây thì hãy sao chép và dán nó
Sơ đồ trang web: http://yourblourll.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500
Nếu bạn có hơn 500 bài viết thì hãy sử dụng 2 mã được cung cấp dưới đây:
Sơ đồ trang web: http://yourblogurll.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=500