Back to Question Center
0

ਮਿਣਤੀ: ਕੀ ਇੰਡੈਕਸਿੰਗ ਬੋਟ ਦੁਆਰਾ ਵਰਤੇ ਗਏ IP ਐਡਰੈੱਸ ਦੀ ਇੱਕ ਸੂਚਕਾਂਕ ਹੈ?

1 answers:

ਮੇਰੇ ਕੋਲ ਇੱਕ ਪੇਜ ਹੈ ਜੋ ਘੱਟ ਤੋਂ ਘੱਟ ਆਵਾਜਾਈ ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ, ਪਰ ਜਦੋਂ ਮੈਂ ਉਸ ਨੂੰ ਹਿੱਟ ਕਰ ਦਿੰਦਾ ਹਾਂ ਤਾਂ ਸਥਾਈ ਨੋਟੀਫਿਕੇਸ਼ਨ ਸਥਾਪਤ ਕਰਦਾ ਹੈ. ਹੁਣ, ਮੈਂ ਬੋਟ ਨੂੰ ਅਣਡਿੱਠ ਕਰਨਾ ਚਾਹੁੰਦਾ ਹਾਂ, ਇਸ ਲਈ ਜੋ ਮੈਂ ਹੁਣ ਕਰ ਰਿਹਾ ਹਾਂ ਉਹ ਬੋਟਾਂ ਨੂੰ ਜੋੜ ਰਿਹਾ ਹੈ ਜੋ ਮੈਂ "ਨਹੀਂ ਸੂਚਿਤ" ਸੂਚੀ ਨੂੰ ਦੇਖ ਰਿਹਾ ਹਾਂ. g, ਜਿਵੇਂ ਇੱਕ ਸੂਚੀ:

     $ no_mail = ਐਰੇ ('67 - tonalin 1300 mg cla solgar. 195. 115. 105 ', // ਯਾਹੂ ਬੋਟ'207. 46. 199. 50 ', // MSN ਬੋਟ'61. 135. 249. 246 ', // ਯੂਡਾਓ ਬੋਟ'207. 46. 199. 32 ', // MSN ਬੋਟ
);    
February 9, 2018

http: // www. ਯੂਜ਼ਰ-ਏਜੰਟ. org / ਉਹ ਹੋ ਸਕਦਾ ਹੈ ਜੋ ਤੁਸੀਂ ਲੱਭ ਰਹੇ ਹੋ.

ਸਾਰੇ ਖੋਜ ਇੰਜਣ ਬਹੁਤ ਸਾਰੇ IP ਪਤੇ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹਨ. ਤੁਸੀਂ ਇਸ ਦੀ ਬਜਾਏ ਯੂਜ਼ਰ ਏਜੰਟ ਸਟ੍ਰਿੰਗ ਨੂੰ ਵੇਖਣਾ ਚਾਹੋਗੇ. ਸਾਰੇ ਸੈਲਰਾਂ ਦੀ ਚੰਗੀ ਸੂਚੀ ਲਈ ਚੈੱਕ ਇਸ ਪੰਨੇ ਦੀ ਜਾਂਚ ਕਰੋ.

PHP ਵਿੱਚ, ਇਸ ਤਰਾਂ ਦੀ ਕੁਝ ਕੰਮ ਕਰੇਗੀ:

  $ ਬੋਟ = ਐਰੇ ('googlebot', 'msnbot', 'slurp', 'mediapartners-google');
$ isRobot = false;
$ ua = strtolower ($ _SERVER ['HTTP_USER_AGENT']);ਫੋਰਚਚ ($ ਬੋਟ $ ਬੋਟ) {ਜੇ (ਸਟਰੋਪ ($ ua, $ bot)! == ਗਲਤ)$ isRobot = true;
}ਜੇ (! $ isRobot) {// ਆਪਣਾ ਕੰਮ ਕਰੋ
} 

ਤੁਸੀਂ ਇਸ ਨੂੰ ਆਪਣੇ ਰੋਬੋਟਾਂ ਵਿੱਚ ਕਿਉਂ ਨਹੀਂ ਲਗਾਉਂਦੇ?. txt ਫਾਇਲ?

  ਉਪਯੋਗਕਰਤਾ-ਏਜੰਟ: *
ਨਾਮਨਜ਼ੂਰ ਕਰੋ: / ਪਾਥ / ਪੰਨੇ-ਤੁਸੀਂ-ਡੌਟ-ਚਾਹੁੰਦੇ-ਕ੍ਰੌਲੇ ਨਹੀਂ. html 

ਇਸ ਤਰੀਕੇ ਨਾਲ ਤੁਹਾਨੂੰ ਬੋਟਾਂ ਲਈ ਸ਼ਿਕਾਰ ਰੱਖਣਾ ਜ਼ਰੂਰੀ ਨਹੀਂ ਹੋਵੇਗਾ. ਮੈਂ ਕਿਸੇ ਵੀ ਚੀਜ਼ ਨੂੰ ਸੱਟਾ ਲਗਾਵਾਂਗਾ ਜੋ ਕਿ ਗੂਗਲ, ​​ਯਾਹੂ ਅਤੇ ਐਮਐਸਐਨ ਕੋਲ ਸੈਂਕੜੇ ਬੋਟ ਹਨ ਅਤੇ ਉਹਨਾਂ ਕੋਲ ਸ਼ਾਇਦ ਵੱਖਰੇ IP ਪਤੇ ਹਨ ਅਤੇ ਨਵੇਂ ਬਣਾਏ ਜਾ ਰਹੇ ਹਨ.ਉਪਰੋਕਤ ਨੂੰ ਜੋੜਨਾ ਤੁਹਾਡੇ ਫਾਈਲ ਪੇਜ ਲਈ ਬਿਨਾਂ ਕਿਸੇ ਵੀ ਪਰੇਸ਼ਾਨੀ ਦੇ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ.

http: // ekstreme ਤੇ ਬੋਟਾਂ ਨੂੰ ਪਛਾਣਨ ਲਈ ਕੁਝ ਕੋਡ ਹੁੰਦਾ ਹੈ. com / phplabs / search-engine-authentication (ਦੇ ਨਾਲ ਨਾਲ Google help center article at http: // www. ਗੂਗਲ. com / support / webmasters / bin / answer. pb? answer = 80553 Googlebot ਦੀ ਤਸਦੀਕ ਕਰਨ ਤੇ). ਇੱਥੇ ਕੁਝ ਕੋਡ http: // ekstreme ਵੀ ਮੌਜੂਦ ਹੈ. com / phplabs / crawlercontroller. php , ਜੋ ਕਿ ਸਪ੍ਰਾਰਾਂ ਨੂੰ ਪਛਾਣਨ ਲਈ ਵਰਤਿਆ ਜਾ ਸਕਦਾ ਹੈ, ਜਿਹਨਾਂ ਨੂੰ ਤੁਸੀਂ "ਚੰਗੇ" ਸਪੋਰਟਰਾਂ ਅਤੇ ਨਾਲ ਹੀ ਸਪੈਮਮੀ ਲੋਕਾਂ ਨੂੰ ਪਛਾਣਨ ਲਈ ਆਸਾਨੀ ਨਾਲ ਵਧਾ ਸਕਦੇ ਹੋ.

ਆਮ ਤੌਰ 'ਤੇ, ਇਹ ਜ਼ਰੂਰੀ ਹੈ ਕਿ ਉਪਭੋਗਤਾ-ਏਜੰਟ ਨਾਮ ਜਾਂ ਆਈਪੀ ਐਡਰੈੱਸ' ਤੇ ਨਿਰਭਰ ਨਾ ਹੋਣਾ ਹੋਵੇ, ਕਿਉਂਕਿ ਕੁਝ ਉਪਭੋਗਤਾ-ਏਜੰਟ ਆਮ ਯੂਜ਼ਰਸ ਦੁਆਰਾ ਵਰਤੇ ਜਾ ਸਕਦੇ ਹਨ ਅਤੇ ਕੁਝ IP ਪਤੇ ਸ਼ੇਅਰ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ.

ਨੇ ਕਿਹਾ ਕਿ, ਜੇ ਤੁਸੀਂ ਸਿਰਫ ਈ-ਮੇਲ ਸੂਚਨਾਵਾਂ ਲਈ ਇਸ ਦੀ ਵਰਤੋਂ ਕਰ ਰਹੇ ਹੋ, ਤਾਂ ਮੈਂ ਸ਼ਾਇਦ ਉਪਭੋਗਤਾ-ਏਜੰਟ ਵਿਚ ਆਮ ਜਾਣੇ ਜਾਣ ਵਾਲੇ ਪੈਟਰਨਾਂ ਨੂੰ ਅਣਡਿੱਠ ਕਰ ਦੇਵਾਂ ਅਤੇ ਝੂਠੇ ਸਕਾਰਾਤਮਕ ਅਤੇ ਝੂਠੇ ਨਕਾਰਾਤਮਕ. ਸਭ ਤੋਂ ਵੱਧ ਆਮ ਸਪ੍ਰੋਲਰ ਲਈ ਆਪਣੀਆਂ ਲਾਗ ਫਾਈਲਾਂ ਦੀ ਜਾਂਚ ਕਰੋ ਜੋ ਤੁਹਾਡੀ ਸਾਈਟ ਤੇ ਕਿਰਿਆਸ਼ੀਲ ਹਨ ਅਤੇ ਕੇਵਲ ਉਪਭੋਗਤਾ-ਏਜੰਟ ਦੇ ਨਾਮ ਦਾ ਵਿਲੱਖਣ ਹਿੱਸਾ ਚੈੱਕ ਕਰੋ (ਇਹ ਸਿਰਫ਼ "googlebot | slurp | msnbot | bingbot" ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਕਾਫੀ ਹੋ ਸਕਦਾ ਹੈ).

ਇਕ ਤਰੀਕਾ ਹੈ ਜਾਂ ਦੂਜਾ ਜੇ ਤੁਸੀਂ ਬੋਟਿਆਂ ਨੂੰ ਫਿਲਟਰ ਕਰਨ ਬਾਰੇ ਗੰਭੀਰ ਹੋ ਤਾਂ ਤੁਹਾਨੂੰ ਕੁਝ ਸਥਾਨਕ ਸੂਚੀ ਨੂੰ ਲਾਗੂ ਕਰਨ ਦੀ ਲੋੜ ਹੋਵੇਗੀ. ਕਦੇ-ਕਦਾਈਂ ਲਗਾਤਾਰ ਆਈਪੀ ਨੂੰ ਉਹ ਵੈਬਸਾਈਟ ਜਿਸ ਨਾਲ ਮੈਂ ਪ੍ਰਬੰਧਿਤ ਹਾਂ. ਯੂਨੀਵਰਸਿਟੀ ਪ੍ਰੋਜੈਕਟ, ਪ੍ਰਭਾਵੀ ਜਾਪਦੇ ਬੋਟਾਂ ਨੂੰ ਬਹੁਤ ਮਾੜੇ ਢੰਗ ਨਾਲ ਲਾਗੂ ਕੀਤਾ ਗਿਆ ਹੈ ਪਰ ਆਮ ਤੌਰ ਤੇ ਉਹ ਨਹੀਂ ਪਛਾਣੇ ਗਏ ਹਨ.

ਇਸ ਤੋਂ ਇਲਾਵਾ: ਕੁਇਲ ਬੋਟ (ਟਵੀਸਲਰ) ਸ਼ੈਤਾਨ ਹੈ.

ਕੀ ਤੁਸੀਂ ਉਪਭੋਗਤਾ ਨੂੰ ਪਹੁੰਚ ਸਕਦੇ ਹੋ? ਇਹ ਮੇਰੇ ਲਈ ਇਕ ਵਧੀਆ ਤਰੀਕਾ ਹੈ ਜੋ ਅਸਲ ਯੂਜ਼ਰ ਹੈ ਅਤੇ ਇਕ ਬੋਟ ਕੀ ਹੈ - ਇਹ ਜਾਇਜ਼ ਕ੍ਰਿਲਰਾਂ ਨੂੰ ਪਤਿਆਂ ਨੂੰ ਬਦਲਣ ਲਈ ਵਧੇਰੇ ਲਚਕੀਲਾ ਹੈ, ਅਤੇ ਜੇਕਰ ਕੋਈ ਬੋਟ ਦੇ ਤੌਰ ਤੇ ਮਖੌਡ਼ਿਆ ਹੋਇਆ ਹੈ ਤਾਂ ਤੁਸੀਂ ਸ਼ਾਇਦ ਈ-ਮੇਲ ਪ੍ਰਾਪਤ ਨਹੀਂ ਕਰਨਾ ਚਾਹੁੰਦੇ ਵੀ.

ਇਸ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰੋ

  $ UI_Agent = $ _SERVER ['HTTP_USER_AGENT'];ਜੇ (ਏਰੇਗੀ ("ਬੋਟ", $ UI_Agent)) {// ਇੱਥੇ ਆਪਣੇ ਬੋਟ ਖੇਹ ਕਰਦੇ ਹੋ
} 

ਐਚਥ, ਬਡ