Semalt, botlardan, örümceklerden və taraclardan necə davranacağınıza dair göstərişlər verir

Axtarış motoru dostluq URL-lərini yaratmaqdan başqa .htaccess faylı veb-ustalarına veb-saytlarına daxil olmaq üçün xüsusi botları blok etməyə imkan verir. Bu robotları bloklamağın bir yolu robots.txt faylı vasitəsidir. Bununla birlikdə, Semalt Müştəri Müvəffəqiyyəti Meneceri Ross Barber bəzi sürünənlərin bu tələbi qulaqardına vurduğunu gördüyünü bildirir. Ən yaxşı yollardan biri məzmununuzu indeksləşdirməməsi üçün .htaccess faylından istifadə etməkdir.

Bu botlar nədir?

Bunlar, axtarış motorları tərəfindən İnternetdən indeksləşdirmə məqsədi ilə yeni məzmunu silmək üçün istifadə olunan bir proqram növüdür.

Aşağıdakı vəzifələri yerinə yetirirlər:

  • Bağladığınız veb səhifələrə daxil olun
  • HTML kodunuzu səhvlərə görə yoxlayın
  • Bağladığınız hansı veb səhifəni saxlayır və məzmuna hansı veb səhifələrin bağlandığını görürlər
  • Məzmununuzu indeksləşdirirlər

Ancaq bəzi botlar zərərli olduğundan saytınızı adətən istənməyən mesajlar və ya spam göndərmək üçün istifadə olunan e-poçt ünvanları və formaları axtarın. Digərləri hətta kodunuzdakı təhlükəsizlik boşluqlarını axtarırlar.

Veb tarayıcıların qarşısını almaq üçün nə lazımdır?

.Htaccess faylını istifadə etməzdən əvvəl aşağıdakıları yoxlamaq lazımdır:

1. Saytınız bir Apache serverində işləməlidir. İndiki halda, hətta bu veb hosting şirkətləri işlərində yarı layiqli olsa da, tələb olunan faylı əldə etmək imkanı verir.

2. Veb saytınızın xam server qeydlərinə giriş əldə etməlisiniz ki, veb səhifələrinizə hansı botlardan baxdıqlarını tapa bilərsiniz.

Bütün zərərli botları blok edə bilməyəcəyiniz halda, faydalı hesab etdiyiniz şəxsləri də blok edə bilməyəcəyinizi unutmayın. Hər gün yeni botlar ortaya çıxır və köhnələri dəyişdirilir. Ən səmərəli yol, kodunuzu təmin etmək və botlara spam göndərməyinizi çətinləşdirməkdir.

Botlarni müəyyənləşdirmək

Botlar ya IP ünvanı, ya da HTTP başlıqlarına göndərdikləri "İstifadəçi Agent String" dən müəyyən edilə bilər. Məsələn, Google "Googlebot" istifadə edir.

.Htaccess istifadə etməkdən çəkinmək istədiyiniz botunuzun adı varsa, bu siyahıya 302 botlara ehtiyacınız ola bilər.

Başqa bir yol, bütün giriş sənədlərini serverdən yükləmək və mətn redaktoru istifadə edərək açmaqdır. Serverdəki yeri serverinizin konfiqurasiyasına görə dəyişə bilər. Əgər onları tapa bilmirsinizsə, veb hostunuzdan kömək istəyin.

Hansı səhifənin ziyarət olunduğunu və ya ziyarət vaxtını bilirsinizsə, istenmeyen bot ilə gəlmək daha asandır. Giriş faylını bu parametrlərlə axtara bilərsiniz.

Bir dəfə, hansı botları bloklamaq lazım olduğunu qeyd etdiniz; sonra onları .htaccess faylına daxil edə bilərsiniz. Unutmayın ki, botu blok etmək onu dayandırmaq üçün kifayət deyil. Yeni bir IP və ya ad ilə geri dönə bilər.

Onları necə əngəlləmək olar

.Htaccess faylının bir nüsxəsini yükləyin. Lazım gələrsə ehtiyat nüsxələrini düzəldin.

Metod 1: IP tərəfindən bloklanmaq

Bu kod parçası 197.0.0.1 IP ünvanından istifadə edərək botu bloklayır

Sifariş verməkdən imtina edin, icazə verin

197.0.0.1-dən imtina edin

Birinci sətir, serverin göstərdiyiniz nümunələrə uyğun bütün tələbləri blok edəcəyini və digərlərinə icazə verəcəyini bildirir.

İkinci sətir serverə 403: qadağan bir səhifə buraxmağı deyir

Metod 2: İstifadəçi agentləri tərəfindən bloklanması

Ən asan yol Apache'nin yenidən yazma motorunu istifadə etməkdir

RewriteEngine Yandırın

RewriteCond% {HTTP_USER_AGENT} BotUserAgent

RewriteRule. - [F, L]

Birinci sətir yenidən yazma modulunun aktiv olmasını təmin edir. İkinci sətir qaydanın tətbiq olunduğu şərtdir. 4-cü sətirdə olan "F", serverə 403 qayıtmağı söyləyir: "L" bu son qayda deməkdir.

Bundan sonra .htaccess faylı serverinizə yükləyəcək və mövcud birini yazacaqsınız. Vaxt keçdikcə botun IP-ni yeniləməlisiniz. Səhv etsəniz, etdiyiniz ehtiyat nüsxəsini yükləyin.

mass gmail