ویب سائٹس

نیا سافٹ ویئر بٹس سکریپنگ ویب سائٹ ڈیٹا کا پتہ لگاتا ہے

سوا - غابة المعمورة تواجه خطر الاندثار

سوا - غابة المعمورة تواجه خطر الاندثار
Anonim

نوکری بورڈز جیسے ویب سائٹس ایک مستقل مسئلہ کا سامنا کرتے ہیں: ان کے اعدادوشمار خود کار طریقے سے خودکار بٹس کی طرف سے پائلٹ کی جاتی ہیں.

ڈیٹا دیگر مسابقتی نوکری بورڈوں پر ختم ہو چکا ہے جس نے مواد کو چوری کیا ہے. یہ ایک ایسی مسئلہ ہے جو کسی ویب سائٹ پر افسوس رکھتا ہے جس کی دانشورانہ جائیداد کو عوامی طور پر مفت کے لئے یا سبسکرائب ماڈل کے ساتھ بھیجا جائے.

لیکن ایک اٹلانٹا کی بنیاد پر سیکورٹی کمپنی جس نے بٹوں کا پتہ لگانے میں مہارت حاصل کی ہے وہ سافٹ ویئر تیار کر لیتا ہے جو اس سکرین سکریپنگ کا پتہ لگائے اور ڈیٹا کان کنی کے بوٹس.

[مزید پڑھنے: آپ کے ونڈوز پی سی سے میلویئر کو کیسے ہٹا دیں]

انسانیت کا حامل مصنوعات، انسانی نمائش، خود کار طریقے سے بٹس کا پتہ لگاتا ہے، مثال کے طور پر، ویب پر مبنی فارم میں اسپیم درج کریں یا مفت کے لئے رجسٹر ای میل اکاؤنٹس کو اسپام کیلئے استعمال کیا جائے گا.

پرامانا نے انسانی ماخذ کے لئے اب "ڈیٹا کان کنی اور اسکرین سکریپنگ کی روک تھام" کہا جاتا ہے ماڈیول تیار کیا ہے. پرامانا کے سی ای او، ڈیوڈ کروڈر نے کہا کہ یہ انسان کے عام طور پر ایک ویب کے ساتھ بات چیت کے ذریعے اختلافات کو نظر انداز کرنے کے ذریعے بوٹ کا پتہ لگانے کے کر سکتے ہیں. صفحہ اور اس کے برعکس کہ کس طرح کے برتن چلتے ہیں. یہ 30 سے ​​زائد میٹرکس، جیسے کی بورڈ سٹروک، ماؤس کلکس اور ان کے اعمال کا وقت لگتا ہے.

انسانی نمائش ایک ٹرانزیکشن لگ رہا ہے، لیکن اعداد و شمار کے کان کنی ماڈیول ایک وقت کی مدت کو دیکھنے کے لئے نظر ثانی کی گئی ہے جب یا تو ایک بوٹ Crowder نے کہا کہ یا انسان اس سائٹ پر ہے.

ڈیٹا کان کنی کے بٹس کو براؤزر کے صارف انٹرفیس کو مکمل طور پر خراب کرنا ہوتا ہے. مثال کے طور پر، ایک بوٹ ویب صفحہ کو بہت سارے اور بہت سے اعداد و شمار کی درخواست کرسکتا ہے، لیکن کسی صفحے پر کبھی بھی سکرال یا کلک نہیں ہوتا ہے. اگر صفحات کی ایک سلسلہ کھول دی جاتی ہے اور اس انداز میں دیکھا جاتا ہے تو اس کا مطلب یہ ہے کہ ڈیٹا کان کنی بوٹ پہنچا ہے.

پرامانا وزیٹر کو ایک منفرد شناخت فراہم کرتا ہے، اور وزیراعظم کے رویے کا تجزیہ کرنے کے بعد، یہ فیصلہ کر سکتا ہے کہ لیبل کیا جائے وزیٹر ایک بوٹ یا نہیں. ویب سائٹ کے آپریٹر کے کئی مختلف طریقے موجود ہیں کہ اس صورت حال سے نمٹنے کے لئے انتخاب کر سکتے ہیں.

بوٹ کے کمپیوٹر کے آئی پی (انٹرنیٹ پروٹوکول) ایڈریس مستقل طور پر بلاک ہوسکتا ہے. ایک کار نیلامی ویب سائٹ جو پرامانا کے ڈیٹا کان کنی ماڈیول کی جانچ پڑتال کر رہا ہے، مشتبہ بوٹوں کو "سینڈ باکس" میں منتقل کرنے کا فیصلہ کیا گیا ہے جہاں یہ مکمل طور پر غلط ڈیٹا فراہم کرتا ہے.

"وہ واقعی میں کان کنی کے ڈیٹا ہیں - یہ صرف مردہ غلط ہے".

دیگر اختیارات میں ویب سائٹ کے وزیٹر کو ایک چیلنج یا کام کے ساتھ فوری طور پر فروغ دینا شامل ہے، جس میں کچھ بوٹ مکمل کرنے کے قابل نہیں ہیں.

ڈیٹا کان کنی کی لاگت کمپنیوں کو پیار سے. کمپنیوں جو پریمیم ڈیٹا فروخت کرتے ہیں اس سے پتہ چلیں گے کہ ان کے حریفوں کو ایک رکنیت خریدیں گے اور پھر اپنے خود کار طریقے سے اعداد و شمار کو چوری کرنے کے لۓ خودکار بٹس استعمال کریں گے. ایک مثال میں، ایک ویب سائٹ جس میں استعمال شدہ کار کی قیمتوں پر ڈیٹا کی گیگیابیٹ کا پتہ چلا ہے ان کا ڈیٹا سکریپ کیا گیا تھا اور ای بے پر فروخت کے لئے تھا.

"وہ دراصل ان کے اپنے مواد سے مقابلہ کررہے ہیں." ​​

کچھ ویب سائٹس میں غریب ڈیزائن موجود ہیں جو اعداد و شمار کو بہت آسان بناتے ہیں. کروڈر نے کہا کہ استعمال کیا کار سائٹ URLs (یونیفارم ریسورس لوکٹرز) کو مزید ڈیٹا کو ظاہر کرنے کے لئے ترتیب میں نظر ثانی کی جا سکتی ہے.

اعداد و شمار کے کان کنی ماڈیول اب انسانی نمائندگی کی مصنوعات میں لپیٹ ہو جائے گا، لیکن اگلے سال کے آغاز پرامان اسے فروخت کرنے کا ارادہ رکھتے ہیں. علیحدگی سے، کرڈر نے کہا. پراامانا انسانی طور پر یا پھر ایک پرائمری آلات کے طور پر یا سافٹ ویئر کے طور پر سروس کی ترتیب کے طور پر پیش کرتا ہے.

ساؤس (ایک سروس کے طور پر سافٹ ویئر) کی پیشکش کے لئے پرامانا کی ٹیکنالوجی ویب ایپلی کیشن میں شامل ہے اور سیشن کی معلومات واپس بھیج دی جاتی ہے. تجزیہ کے لئے پرامن. کروڈر نے کہا کہ پرامان اس کے تازہ ترین ورژن میں وابستہ وقت پر نمایاں طور پر کم کرنے میں کامیاب ہو چکے ہیں. گاہکوں کو جو زیادہ رفتار کی ضرورت ہے، اس کے آلات دستیاب ہے.