خراب کردن محتوا (با نام مستعار تراشیدن وب ، برداشت وب ، داده کاوی وب و غیره) روشی است برای کپی کردن داده ها از یک وب سایت. "خراشنده ها" (برف پاک کن) محتوا افراد یا نرم افزاری هستند که داده ها را کپی می کنند. تراشیدن وب چیز بدی نیست.

در واقع ، همه مرورگرهای وب اساساً اسکرابر محتوا هستند. برای انجام خراش محتوا اهداف قانونی بسیاری وجود دارد ، مانند فهرست کردن وب برای موتورهای جستجو ، به عنوان مثال.

مقاله ما را ببینید چگونه می توان گوگل را از نمایه سازی وبلاگ وردپرس شما متوقف کرد

نگرانی واقعی این است که آیا اسکرابر محتوا در وب سایت شما مضر است یا خیر. ممکن است رقبا بخواهند محتوای شما را سرقت کنند و آن را به عنوان متعلق به آنها منتشر کنید. اگر می توانید از افراد بدجنس به کاربران قانونی بگویید ، شانس بهتری برای محافظت از خود دارید. در این مقاله اصول اولیه scraping وب و همچنین برخی از روش های خلاص شدن از شر آن توضیح داده شده است (یا حداقل اهمیت آنها را کاهش می دهد).

اما قبل از آن ، اگر هرگز WordPress را نصب نکرده اید کشف کنید نحوه نصب a وبلاگ وردپرس در 7 مرحله et چگونه برای پیدا کردن، نصب و فعال یک تم وردپرس در وبلاگ خود 

سپس به این دلیل که چرا ما اینجا هستیم

انواع اسکرپ محرمانه

روش های مختلفی برای اسکن کننده های محتوا برای بارگیری داده ها وجود دارد. شناختن روشهای مختلف و فناوری مورد استفاده آنها بسیار مهم است. این روش ها از تکنولوژی پایین (یک فرد به طور دستی کپی و لمس کردن محتوا) به روبات های پیشرفته (نرم افزار خودکار قادر به شبیه سازی فعالیت های انسانی در یک مرورگر). در اینجا خلاصه ای از کارهایی که ممکن است انجام دهید وجود دارد:

  • عنکبوت: خزیدن در وب قسمت بزرگی از نحوه عملکرد اسکرابر محتوا است. عنکبوتی مانند googlebot مرتبه با انتخاب یک صفحه وب شروع می شود و برای بارگیری صفحات وب از لینک به لینک می روید.
  • اسکریپت های شل: شما می توانید از Linux Shell برای ایجاد محتوا با اسکریپت هایی مانند GNU Wget برای بارگیری محتوا استفاده کنید.
  • scraper HTML: آنها شبیه اسکریپتهای پوسته هستند. این نوع سوهان بسیار رایج است. این کار با بدست آوردن ساختار HTML یک وب سایت برای یافتن داده ها کار می کند.
  • صفحه نمایش: صفحه پاک کن برنامه ای است که با تقلید از رفتار کاربر انسانی که از کامپیوتر برای مرور اینترنت استفاده می کند ، داده های یک وب سایت را ضبط می کند.
  • کپی انسان: اینجا جایی است که شخصی به صورت دستی مطالب را از وب سایت شما کپی می کند. اگر تا به حال به صورت آنلاین پست کرده اید ، ممکن است متوجه شده باشید که دزدی ادبی بسیار گسترده است. پس از این که چاپلوسی اولیه از بین رفت ، واقعیتی که شخصی از کار شما سود می برد متناسب است.

چندین روش برای انجام همین کار وجود دارد. دسته بندی های تراشنده های ذکر شده در بالا یک لیست جامع نیست. علاوه بر این ، همپوشانی زیادی بین دسته ها وجود دارد.

مقاله ما را نیز بخوانید چرا و چگونه یک ممیزی کیفی مطالب خود را

چگونه از وبلاگ خود محافظت کنیم

از یک وبلاگ در برابر خراشندگان محتوا محافظت کنید

1. محدود کردن و مسدود کردن نرخ

در ابتدا می توانید با ربات ها مقابله کنید. این برای یک ربات خودکار معمول است سرور خود را اسپم کنید با تعداد فوق العاده زیاد درخواست. همانطور که از نامش پیداست ، نرخ throtling با تنظیم یک قانون ، درخواست های سرور از یک مشتری خاص را محدود می کند.

می توانید کارهایی مانند اندازه گیری میلی ثانیه بین درخواست ها را انجام دهید. اگر تعامل با وب سایت شما خیلی سریع است ، می دانید که این یک ربات است. بعد از آن این آدرس IP را مسدود کنید. می توانید آدرس های IP را بر اساس تعدادی از معیارها از جمله کشور مبدا آنها مسدود کنید.

2. ثبت نام و اتصال

ثبت نام و ورود به سیستم یک روش محبوب برای جلوگیری از محتوا از چشم کنجکاو هستند. می توانید مانع پیشرفت ربات ها شوید. تمام کاری که شما باید انجام دهید این است که دسترسی به محتوای خود را منوط به اتصال کنید. اصول امنیت ورود به سیستم در اینجا اعمال می شود. به خاطر داشته باشید که صفحات نیاز به ثبت نام و ورود توسط موتورهای جستجو فهرست نمی شوند.

3. Honeypots و داده های نادرست

در علوم کامپیوتر ، "هانی پات" یک عمل نیش زدن مجازی است. شما با تعیین تله هایی با یک گلدان عسل ، مهاجمان احتمالی را جمع می کنید تا ترافیک موجود در محتوا را تشخیص دهید. تعداد بیشماری روش برای این کار وجود دارد.

به عنوان مثال ، می توانید یک پیوند نامرئی به صفحه وب خود اضافه کنید. بعد ، یک الگوریتم ایجاد کنید که آدرس IP مشتری را که روی پیوند کلیک کرده است مسدود کند. گلدان های عسلی پیچیده تر ، تنظیم و نگهداری آنها دشوار است. خبر خوب این است که بسیاری از پروژه های منبع آزاد Honeypot وجود دارد. این عالی را ببینید لیستی از هانی پات های جذاب در github.

4- از CAPTCHA استفاده کنید

Captcha به معنی " به طور کامل تست خودکار عمومی تورینگ رایانه ها و انسان را از هم اساسا، آزمایشی برای تشخیص تفاوت بین انسان و روبات. کپچاها می توانند خسته کننده باشند، اما مفید نیز هستند. می‌توانید از یک برای مسدود کردن مناطقی که فکر می‌کنید یک ربات می‌خواهد هدف قرار دهد، مانند دکمه ایمیل روی شما، استفاده کنید فرم تماس. افزونه های کپچا زیادی در وردپرس موجود است، از جمله " کد امنیتی از Jetpack.

همچنین برخی از افزونه های برتر WordPress را کشف کنید  

می توانید از موارد دیگر استفاده کنید افزونه های وردپرس برای دادن ظاهری مدرن و بهینه سازی مدیریت وبلاگ یا وب سایت شما.

ما در اینجا برخی از افزونه های برتر وردپرس را به شما پیشنهاد می دهیم که در انجام این کار به شما کمک می کنند.

1. نوار برای Arforms

ARForms دارای پسوند جدیدی است که پرداخت ها را از طریق درگاه پرداخت Stripe می پذیرد. این "ARForms Stripe" نامیده می شود. دومی ورودی ها و پرداخت های فرم را در یک فرآیند واحد ادغام می کند.

راه راه برای شکلات

شما می توانید مشتریان قبض با مقدار پویا بلافاصله پس از ارسال فرم ARForms.

مقاله ما را نیز بخوانید نحوه استفاده از خط خطی در WooCommerce و Easy Digital Download

فقط کافی است با ARForms یک فرم ایجاد کنید ، آن را با Stripe پیکربندی کنید و همه چیز انجام شده است! شما می توانید در هیچ زمان پرداخت توسط Stripe تنظیم کنید.

دانلود | نسخه ی نمایشی | میزبانی وب

2. جریان اجتماعی AX

اگر شما می خواهید چندین فید رسانه رسانه ای را در وب سایت خود نمایش دهید، سپس پلاگین صفحه اجتماعی WordPress این کار را با ارائه شش روش برای مشاهده فعالیت حساب به شما امکان می دهد. همچنین از پشتیبانی 17 شبکه اجتماعی و چندین طرح قابل تنظیم نیز بهره مند خواهید شد.

افزونه وردپرس جریان اجتماعی آکس

ویژگی های آن از جمله موارد دیگر است: 6 حالت مختلف نمایش فید ، پشتیبانی از اکثریت شبکه های اجتماعی ، طرح کاملاً پاسخگو ، پشتیبانی از آگهی های تبلیغاتی, پشتیبانی چند زبانه، یک مدیر طرح زمینه ، مستندات دقیق و غیره ...

دانلود | نسخه ی نمایشی | میزبانی وب

3. نقشه جهانی تعاملی

نقشه های جهانی تعاملی به شما کمک می کند تا به دلخواه نقشه های موقعیت جغرافیایی ، قاره ها ، کشورها یا مناطق ... و اینها را با نشانگرهای تعاملی و رنگی ایجاد کنید.

نقشه جهانی تعاملی

با آخرین نسخه های وردپرس سازگار است و کاملاً با آن متناسب است پلاگین ویژوال آهنگساز.

کشف ما پلاگین های WordPress 8 برای سفارشی کردن ظاهر وب سایت شما

با تشکر از نقشه های جهانی تعاملی ، می توانید چندین منطقه مختلف از جمله: نقشه کل جهان ، قاره یا شبه قاره ، یک کشور و موارد دیگر را به نمایش بگذارید.

دانلود نسخه ی نمایشی | میزبانی وب

سایر منابع پیشنهادی

ما همچنین از شما دعوت می کنیم تا با منابع زیر مشورت کنید تا بیشتر در کنترل و کنترل وب سایت و وبلاگ خود باشید.

نتیجه

وجود دارد! این همه چیز برای این آموزش است، امیدوارم به شما کمک کند تا یک لیست عملی از کارها را تنظیم کنید تا به طور موثر از خود محافظت کنید. وبلاگ وردپرسدر صورت تمایل به این نکته را با دوستان خود در شبکه های اجتماعی خود به اشتراک بگذارید.

با این حال، شما همچنین می توانید با ما مشورت کنید ressourcesاگر برای اجرای پروژه های ایجاد سایت های اینترنتی به عناصر بیشتری احتیاج دارید ، با مشورت راهنمای ما در مورد ایجاد وبلاگ وردپرس.

در ضمن ، در مورد خودتان به ما بگویید نظر و پیشنهادات در بخش اختصاصی

...