InternetTối ưu hóa công cụ tìm kiếm

Indexing trong công cụ tìm kiếm. Làm thế nào được lập chỉ mục trang web trong "Yandex" và "Google"

Những gì được lập chỉ mục trang web của bạn? Làm thế nào là nó sẽ đi đâu? Về những điều này và câu hỏi khác mà bạn có thể tìm thấy câu trả lời trong bài viết. lập chỉ mục web (lập chỉ mục trong công cụ tìm kiếm) là quá trình làm quen thông tin về trang web để các công cụ tìm kiếm nhện cơ sở dữ liệu, sau đó được sử dụng để tìm kiếm thông tin về các dự án web mà đã trôi qua một thủ tục như vậy.

Dữ liệu trên các trang web Internet thường bao gồm các từ khóa, bài viết, liên kết và tài liệu. cũng có thể là âm thanh được lập chỉ mục, hình ảnh và vân vân. Được biết, các thuật toán phát hiện là phụ thuộc vào người tìm kiếm từ khóa.

Trên các loại thông tin được lập chỉ mục (file flash, javascript) có một phân định nhất định.

quản lý thông

Trang web chỉ mục - một quá trình phức tạp. Để quản lý nó (ví dụ, ngăn cấm việc bắt đầu của một trang cụ thể), bạn phải sử dụng một tập tin robots.txt và các quy định như Allow, Disallow, Crawl-delay, User-agent và những người khác.

Nó cũng được sử dụng để tiến hành các thẻ chỉ mục và đạo cụ , ẩn nội dung của các tài nguyên từ robot Google và «Yandex» (Yahoo sử dụng thẻ ).

trang web mới được lập chỉ mục bởi một vài ngày đến một tuần trong công cụ tìm kiếm Goglle, và Yandex - từ một tuần đến bốn.

Bạn muốn trang web của bạn để hiển thị trong kết quả truy vấn cụ tìm kiếm? Sau đó, nó cần được xử lý "bởi Rambler", "bởi Yandex" Google, Yahoo và vân vân. Quý vị phải cho các công cụ tìm kiếm (nhện, hệ thống) về sự tồn tại của trang web của bạn, và sau đó họ sẽ quét nó toàn bộ hoặc một phần.

Nhiều trang web không được lập chỉ mục trong nhiều năm. Thông tin mà họ không được chia sẻ với bất cứ ai khác hơn là chủ sở hữu của họ.

Các phương pháp xử lý

Trang web chỉ mục có thể được thực hiện bằng nhiều cách:

  1. Tùy chọn đầu tiên là thủ công bổ sung. Bạn cần phải nhập các chi tiết của trang web của bạn thông qua một hình thức đặc biệt được cung cấp bởi công cụ tìm kiếm.
  2. Trong trường hợp thứ hai, các robot công cụ tìm kiếm tìm thấy các liên kết trang web của riêng bạn và lập chỉ mục đó. Nó có thể tìm thấy trang web của bạn thông qua các liên kết từ các nguồn lực khác có trên dự án của bạn. Phương pháp này có hiệu quả nhất. Nếu công cụ tìm kiếm tìm thấy trang web để ông coi nó có ý nghĩa.

điều kiện

Trang web chỉ mục không diễn ra quá nhanh. Những ngày khác nhau từ 1-2 tuần. Liên kết từ các nguồn có thẩm quyền (với một PR tuyệt vời và Tietz) tăng tốc đáng kể trang web triển khai trong công cụ tìm kiếm cơ sở dữ liệu. Hôm nay được coi là Google chậm nhất, mặc dù cho đến năm 2012 nó có thể thực hiện công việc trong một tuần. Thật không may, mọi thứ đang thay đổi rất nhanh chóng. Được biết, Mail.ru làm việc với trang web trong lĩnh vực này cho khoảng sáu tháng.

Indexing trong công cụ tìm kiếm có thể nhận ra không phải mọi chuyên khoa. Thời điểm thêm trang mới vào cơ sở dữ liệu đã được xử lý bởi trang web công cụ tìm kiếm ảnh hưởng đến tần suất điều chỉnh nội dung của nó. Nếu tài nguyên xuất hiện liên tục cập nhật thông tin, hệ thống xem xét nó thường xuyên được cập nhật và hữu ích cho mọi người. Trong trường hợp này, công việc của mình đang tăng tốc.

Trong quá trình lập chỉ mục trang web có thể được theo dõi trên một phần đặc biệt cho các webmaster hoặc công cụ tìm kiếm.

thay đổi

Vì vậy, chúng tôi đã tìm ra cách lập chỉ mục trang web. Cần lưu ý rằng công cụ tìm kiếm cơ sở dữ liệu được cập nhật thường xuyên. Do đó, số tiền thêm vào các trang này cho dự án của bạn có thể thay đổi (hoặc giảm hoặc tăng) vì những lý do sau đây:

  • trừng phạt người tìm kiếm đến một trang web;
  • sự hiện diện của các lỗi trên trang web;
  • thay đổi thuật toán công cụ tìm kiếm;
  • Hosting kinh tởm (bất khả tiếp cận của máy chủ mà trên đó dự án) và vân vân.

Câu trả lời "Yandex" trên các câu hỏi thông thường

"Yandex" - công cụ tìm kiếm, được sử dụng bởi nhiều người sử dụng. Nó đứng thứ năm trong số các hệ thống tìm kiếm của thế giới về số lượng các yêu cầu xử lý bởi các nghiên cứu. Nếu bạn đã thêm nó vào trang web, nó có thể là quá lâu để được bổ sung vào cơ sở dữ liệu.

Thêm một địa chỉ URL không đảm bảo lập chỉ mục. Đây chỉ là một trong những phương pháp mà theo đó các hệ thống robot thông báo rằng một tài nguyên mới là. Nếu liên kết trang web đến các trang web khác hoặc ít Ngoài ra sẽ giúp phát hiện nó một cách nhanh chóng.

Nếu chỉ mục không xảy ra, bạn cần phải kiểm tra nếu có bất kỳ thất bại trên máy chủ tại thời điểm tạo ra các ứng dụng của mình bằng cách robot "Yandex". Nếu máy chủ báo cáo một lỗi, robot đã hoàn thành công việc của mình và cố gắng thực hiện nó trong một bypass cách toàn diện. Người lao động "Yandex" không thể tăng tỷ lệ bổ sung các trang trong cơ sở dữ liệu công cụ tìm kiếm.

trang web chỉ mục "Yandex" - một nhiệm vụ khá khó khăn. Bạn không biết làm thế nào để thêm một nguồn lực vào một công cụ tìm kiếm? Nếu nó có chứa liên kết đến các trang web khác, sau đó thêm trang web đặc biệt là không cần thiết - nó tự động robot sẽ giải nén và chỉ mục. Nếu bạn không có liên kết như vậy, bạn có thể sử dụng hình thức "Add URL», để tuyên bố sự tồn tại của trang web công cụ tìm kiếm.

Nó phải được nhớ rằng việc bổ sung các URL không đảm bảo việc lập chỉ mục của sáng tạo của bạn (và tốc độ của nó).

Nhiều thắc mắc bao nhiêu thời gian cần thiết để index một trang web trong "Yandex". Nhân viên của công ty này không đảm bảo hoặc dự đoán một thời điểm. Theo nguyên tắc chung, vì các robot đã học về trang web, các trang của nó xuất hiện trong việc tìm kiếm hai ngày, đôi khi - một vài tuần.

xử lý

"Yandex" - một công cụ tìm kiếm mà đòi hỏi độ chính xác và sự chú ý. Trang web chỉ mục bao gồm ba phần:

  1. Crawler bóc tách tài nguyên trang.
  2. Nội dung (nội dung) của các trang web được ghi trong hệ thống cơ sở dữ liệu (index) điều tra.
  3. Sau 2-4 tuần sau khi nâng cấp cơ sở dữ liệu, bạn có thể xem kết quả. Trang web của bạn sẽ xuất hiện (hoặc không xuất hiện) trong các kết quả tìm kiếm.

Kiểm tra đánh chỉ mục

Làm thế nào để kiểm tra việc lập chỉ mục trang web của bạn? Thực hiện điều này theo ba cách:

  1. Nhập tên của công ty của họ trong hộp tìm kiếm (ví dụ, "Yandex") và kiểm tra tất cả các liên kết trên trang đầu tiên và thứ hai. Nếu bạn tìm thấy ở đó là URL của con bạn, do đó các robot đã hoàn thành nhiệm vụ của mình.
  2. Bạn có thể nhập địa chỉ URL của trang web của bạn trong dòng điều tra. Bạn có thể thấy, đó là lập chỉ mục bao nhiêu danh sách của bạn được hiển thị.
  3. Đăng ký cho các trang quản trị trang web của Mail.ru, "Gugle", "Yandex". Một khi bạn vượt qua các trang web xác minh, bạn sẽ nhìn thấy kết quả và lập chỉ mục, công cụ tìm kiếm và các dịch vụ khác được thiết kế để cải thiện công việc của cuộc sống của bạn.

Tại sao "Yandex" từ chối?

Indexing trang web của Google như sau: một robot trong một cơ sở dữ liệu đặt tất cả các trang của trang web, và chất lượng không đạt tiêu chuẩn, không có lựa chọn. Nhưng chỉ có tài liệu hữu ích liên quan đến bảng xếp hạng. Một "Yandex" toàn bộ web thùng rác loại trừ ngay lập tức. Nó có thể chỉ mục bất kỳ trang nào, nhưng công cụ tìm kiếm cuối cùng loại bỏ tất cả các mảnh vỡ.

Cả hai hệ thống có một chỉ số bổ sung. Và một và trang chất lượng thấp khác ảnh hưởng đến đánh giá của các trang web nói chung. Nó sử dụng một triết lý đơn giản. nguồn yêu thích một người dùng cụ thể sẽ chiếm một vị trí nổi bật hơn trong dẫn độ ông. Nhưng cùng một cá nhân khó có thể tìm thấy một trang web đó trong thời gian cuối cùng của ông không thích.

Đó là lý do đầu tiên mà bạn phải bao gồm từ việc bản được lập chỉ mục tài liệu web, kiểm tra sự hiện diện của trang trống và không để trong việc ban hành nội dung chất lượng thấp.

Acceleration "Yandex"

Làm thế nào tôi có thể đẩy nhanh tiến độ lập chỉ mục của trang web trong "Yandex"? làm theo các bước sau:

  • Cài đặt trên trình duyệt máy tính của bạn "Yandex" và đi lang thang xung quanh sử dụng nó trên các trang của trang web.
  • Xác nhận quyền quản lý tài nguyên "Yandex.Webmaster".
  • Trên Twitter, gửi một liên kết đến bài viết. Được biết, trong năm 2012, "Yandex" đã được hợp tác với các công ty này.
  • Để thêm một trang web tìm kiếm trên Yandex. Trong mục "Indexing" bạn có thể xác định riêng URL-địa chỉ của bạn.
  • Nhập mã "Yandeks.Metriki" mà không chỉ định đánh dấu "Gửi trang chỉ mục cấm".
  • Sản xuất Sơ đồ trang web chỉ tồn tại cho robot, và không thể nhìn thấy khán giả. Kiểm tra sẽ bắt đầu chỉ với anh ta. địa chỉ sitemap được nhập vào robots.txt hoặc trong một hình thức phù hợp trong "webmaster" - "Thiết lập chỉ mục" - "sitemap Files".

bước trung gian

Những gì bạn cần phải thực hiện, trong khi trang web "bởi Yandex" đã không được lập chỉ mục? công cụ tìm kiếm trong nước nên được coi là nguồn chính của trang web. Đó là lý do tại sao ngay cả trước khi công bố bài viết bạn phải chắc chắn để thêm vào nội dung dưới dạng "văn bản cụ thể,". Nếu không plagiarists sao chép các mục nhập vào cuộc sống của bạn và sẽ có trong cơ sở dữ liệu đầu tiên. Kết quả là, họ sẽ được công nhận bởi các tác giả.

dữ liệu Google Base

Đối với Google sẽ tiếp cận những kiến nghị tương tự, trong đó chúng tôi đã nói ở trên, nhưng các dịch vụ khác là:

  • Google+ (thay vì Twitter);
  • Google Chrome;
  • Google công cụ cho các lập trình viên - "Quét" - "trông giống như Googlebot" - tùy chọn "Scan" - Tùy chọn "Add Index";
  • Tìm kiếm trong một tài nguyên từ "Google";
  • Analytics google (thay vì "Yandeks.Metriki).

cấm

việc cấm của trang web chỉ mục là gì? Bạn có thể áp dụng nó như là một trang đầy đủ, hoặc trên một phần riêng biệt của nó (một liên kết hoặc một đoạn văn bản). Trên thực tế tồn tại như một lệnh cấm toàn cầu về chỉ số hóa và địa phương. Làm thế nào nó được thực hiện?

Hãy xem xét thêm một lệnh cấm đến các trang web công cụ tìm kiếm cơ sở dữ liệu trong Robots.txt. Với file robots.txt, bạn có thể loại trừ lập chỉ mục trang hoặc toàn bộ cột của tài nguyên như sau:

  1. User-agent: *
  2. Disallow: /kolobok.html
  3. Disallow: / foto /

Đoạn thứ nhất cho rằng các hướng dẫn được định nghĩa cho tất cả các trạm biến áp, thứ hai chỉ ra việc cấm kolobok.html nộp lập chỉ mục, và thứ ba - không cho phép bổ sung các cơ sở toàn bộ thư mục điền foto. Nếu bạn có chỉ là một vài trang sách hoặc thư mục, chọn tất cả trong "Robot".

Để ngăn chặn việc lập chỉ mục của tờ web riêng lẻ, bạn có thể sử dụng các thẻ meta robot. Nó khác với một robots.txt cho những hướng dẫn trực tiếp đến tất cả các MS. Thẻ meta này là tùy thuộc vào các nguyên tắc chung về định dạng html. Nó nên được đặt trong tiêu đề trang giữa các thẻ . Entry để bị cấm, ví dụ, có thể được viết như sau: .

Ajax

Điều khiến cho những trang web Ajax-indexing Yandex? Ngày nay, công nghệ Ajax được sử dụng bởi nhiều nhà phát triển của những trang web. Tất nhiên, nó có tiềm năng lớn. Với nó, bạn có thể tạo ra các trang web nhanh nhất và tương tác.

Tuy nhiên, công cụ tìm kiếm Robot tấm web "thấy" không phải là người sử dụng và trình duyệt. Ví dụ, một người nhìn vào một giao diện cảm thấy thoải mái với tấm Internet có thể nạp được di chuyển. nội dung Crawler trên cùng một trang thể để trống hoặc được cung cấp bởi phần còn lại của HTML-nội dung tĩnh, để tạo ra các kịch bản mà không đi vào kinh doanh.

Để tạo URL Ajax trang web có thể được sử dụng với #, nhưng các robot không sử dụng công cụ tìm kiếm. Thông thường một phần của URL sau # tách ra. Điều này cần được đưa vào tính toán. Do đó, thay vì một URL như http://site.ru/#example ông làm cho một yêu cầu của trang chủ nguồn niêm yết tại http://site.ru. Điều này có nghĩa rằng các nội dung trực tuyến của tấm có thể không có trong cơ sở dữ liệu. Kết quả là, nó sẽ không xuất hiện trong kết quả tìm kiếm.

Để cải thiện các trang web Ajax-indexing "Yandex" đã hỗ trợ những thay đổi trong công cụ tìm kiếm và các quy tắc xử lý URL, các trang web như vậy. Hôm nay, các webmaster có thể chỉ định các công cụ tìm kiếm "Yandex" về sự cần thiết cho chỉ mục bằng cách tạo ra một chương trình thích hợp trong cơ cấu tài nguyên. Để làm điều này:

  1. Thay vào URL của trang trên # #!. Bây giờ các robot sẽ nhận ra rằng mình có thể yêu cầu HTML phiên bản của nội dung này Internet tờ.
  2. HTML phiên bản nội dung của một trang như vậy là để được đặt trong URL, nơi #! thay thế bằng? _escaped_fragment_ =.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 vi.birmiss.com. Theme powered by WordPress.