Content Scraping

كيف تتخلص من سرقة المحتوى أو الـ Content Scraping



سرقة المواضيع بشكل تلقائي هي أكبر الهواجس التي تؤثر في مدير الموقع، والسبب يعود لقيام البعض بإستغلال بعض الطرق الخبيثة المنتشرة في BlackHat SEO في عملية التصدّر بأعمال الغير.

اليوم سوف نتعرف على كيفية حماية محتوى موقعك من السرقة وأيضاً كيفية إيقاف عملية Content Scraping من داخل لوحة التحكم الخاصة بموقعك.

 

Content Scraping

 

ما المقصود بـ Content Scraping

معنى هذه الكلمة باللغة العربية هو (جمع المحتوى)، وغالباً ما تترافق هذه الكلمة مع مجموعة أدوات وإضافات تساعد سارق المحتوى على تحويل السرقة إلى عملية تلقائية من دون أي تدخل من قِبله.

بعد أن وصلت تكنلوجيا الإنترنت إلى مراحل متقدمة في الأعوام القليلة الماضية باتت عملية جمع المحتوى أمر بسيط ويسير على الجميع، كل ما تحتاج إليه هو دومين تقوم بتثبيت منصة ووردبريس عليه واستخدام قالب مجاني، وهي قوالب منتشرة بشكل واسع على الإنترنت وبعدها تقوم بتثبيت بعض الإضافات التي ستعمل على جلب المحتوى من مواقع أخرى بشكل تلقائي.

في معهد سيو بالعربي نتلقى بشكل شبه يومي طلبات لكيفية إيقاف عمليات السرقة هذه واليوم قررنا أن نطرح هذا الموضوع لتغطية هذه النقطة الحساسة التي قد تضر المواقع الناشئة بشكل كبير جداً.

 

كيف أعلم أن محتوى موقعي قد تمت سرقته

الكشف عن المحتوى المسروق يعد من أولى الخطوات في عملية الحد من سرقة المحتوى، وأيضاً رفع قيمة المحتوى وترتيبك في عملية البحث، ويتم ذلك بعدة طرق.


البحث عن عنوان مقالك في Google

قد تكون هذه الطريقة غير مجدية في حال قررت البحث عن مقال شعبي كانت قد كتبت عنه العديد من المواقع، ولكن في معظم الأحيان يكون هذا الخيار مثالياً في إيجاد المواقع التي سرقت منك المواضيع ووضعتها على صفحاتها.

Trackbacks – خاصية التتبع في الوردبريس

تتيح لك منصة ووردبريس خاصية التتبع التي تنبهك في حال قيام أحدهم بنقل موضوع يحتوي على رابط داخلي لك. (على الشخص الآخر أن يكون قد فعّل هذه الخاصة لديه ايضاً)

كل ما عليك فعله للعمل بهذه الخاصية هو التركيز على بناء الروابط الداخلية في المواضيع التي تقوم بنشرها.

Search Console – أدوات مشرفي المواقع

أدوات مشرفي المواقع أو كما أصبحت تسمى Search Console قد تكون ذات فعالية كبيرة في كشف المواقع التي تقوم بالنسخ منك عن طريق خطوة بسيطة وهي عرض الروابط القادمة إلى موقعك.

ففي الخطوة السابقة نذكر أننا قمنا بوضع روابط داخلية في مواضيعنا الحصرية وكل من سيقوم بنقل هذه المواضيع بالطرق التلقائية سيقوم تلقائياً ببناء رابط خلفي قادم إلى موقعنا، كما في الصورة:

روابط قادمة إلى الموقع

غالباً ما تكون مواقع النسخ التلقائي موجودة في أول ثلاث نتائج على حسب عددهم وقد تصل الروابط الخلفية القادمة منهم إلى المئات وأحياناً الآلاف. وهنا ستتمكن من التعرف على هذه المواقع بكل سهولة.

 

feedburner – خدمة خلاصات Google

تفعيل هذه الخدمة على منصات ووردبريس تمكنك من التعرف على الاستخدام الغير شرعي لخلاصات موقعك عن طريق خيار في لوحة التحكم أسمه Uncommon uses  كما في الصورة التالية:

إستخدام غير شرعي للمحتوى

كما نلاحظ أن المواقع المخالفة أو التي تستخدم المحتوى بشكل غير شرعي سيتم الإشارة لها هنا، ويجب التنبيه أن هذه العملية ليست دقيقة 100%

 

كيف يجب أن تتعامل مع سارقي المحتوى

أمضى العالم سنوات طويلة ومازال يحارب سارقي المحتوى، وبالرغم من تراجع هذه العملية بشكل كبير إلى أن البعض مازال قادراً على الإستفادة من هذه العملية ضد المواقع الناشئة حيث أن سمعة الموقع لها تأثيرها في تحديد المصداقية. وللتعامل مع عمليات السرقة هناك ثلاث طرق أساسية .

الطريق الأول : لا تفعل شيئاً

بعد سلسلة طويلة من الصراع بين سارقي المحتوى وأصحاب المواقع وجد البعض أن أفضل الطرق للدفاع هي الهجوم عن طريق وضع كمية أكبر من المحتوى عالية الجودة والإستمرار ببناء روابط داخلية ضمن هذا المحتوى.

وبعد تحديث Google panda الأخير، تم فعلياً القضاء على العديد من هذه المواقع التي ما لبثت أن اختفت من البحث بشكل نهائي.


الطريق الثاني: أقتلهم جميعاً !! 

فجّر كامل غضبك على هذه المواقع وأبدأ بمراسلة الموقع طالباً منهم إزالة المواد التي قاموا بنسخها من موقعك وفي حال عدم الاستجابة سننتقل للخطة البديلة وهي مراسلة جمعية حقوق الملكية في حال كان محتواك مسجلاً، خلاف ذلك سنقوم بمراسلة الإستضافة التي تخضع لقوانين حقوق الملكية والتي تعهدت بأن لا تسمح لأي موقع مُستضاف لديها أن يقوم بعملية سرقة المحتوى / Content Scraping وللقيام بذلك نقوم بمايلي:

– قم بالتوجه إلى موقع : http://whois.ws/

– قم بوضع رابط الموقع الذي يقوم بسرقة المحتوى منك.

– ستجد المعلومات على الشكل التالي:

whois

 

 

 

 

 

 

 

 

كما نلاحظ أن المعلومات الشخصية لمسؤل الموقع والمسؤل التقني وايضاً شركة الاستضافة قد ظهرت أمامنا، وعلى سبيل المثال شركة Hostgator تدعم قانون حماية الملكية DMCA (Digital Millennium Copyright Act) ولديها صفحة خاصة للتبليغ عن هذه الاختراقات في حال تمت من قبل أحد المواقع المستضافة لديها.

وغالباً ماتقوم هذه الشركات باتخاذ إجراءات صارمة جداً في حق المواقع المخالفة وهنا تكون قد حققت الإنتقام الذي أردته 🙂 .

 

الطريق الثالث: قم بحظرهم 

يمكنك منع السارقين من الوصول إلى موقعك عن طريق حظر IP الخاص بهم ويكون ذلك بوضعهم في قائمة المنع داخل ملف .htaccess واليك الطريقة.

حصلنا في الخطوة السابقة على أسم Domain Server / Nameserver الخاص بالموقع وللحصول على عنوان IP نقوم عن طريق الويندوز بفتح CMD واجهة الدوس وكتابة الأمر التالي

ping NS2485.HOSTGATOR.COM

يقوم السرفر بالرد علينا وإعطائنا عنوان IP الذي نبحث عنه كما في الصورة

الحصول على أي بي الموقع

إنشاء ملف .htaccess

الخطوة هذه بسيطة جداً، في معظم الأحيان نجد ملف .htaccess في جذر الموقع وفي حال لم تجده يمكنك إنشاءه بالخطوات التالية:

– إذهب إلى أي برنامج FTP

– قم بالدخول لجذر الموقع حيث ملف index

– قم بإنشاء ملف جديد

– أعطه الأسم .htaccess (يمكن تعديله باستخدام المفكرة)

– ضع بداخل الملف الـ IP الذي وصلت إليه بالطريقة التالية:

Deny from 123.123.123

أو يمكنك تحويل السارق لموقع مختلف بالطريقة التالية ( طبعاً نستبدل 123.123.123 بعنوان Ip الذي حصلنا عليه)

RewriteCond %{REMOTE_ADDR} 123\.123\.123\.

RewriteRule .* http://dummyfeed.com/feed [R,L]

كيف يمكنك الإستفادة من سارقي المحتوى

يمكنك الإستفادة من المواقع التي تقوم بسرقة محتوى موقعك عن طريق مجموعة من الطرق التي سنذكرها باختصار

Internal Linking – الروابط الداخلية

قم ببناء روابط داخلية في المواضيع التي يتم سرقتها هذا سيساعدك في الحصول على روابط خارجية بشكل مجاني 🙂
التسويق لعروض Affiliate

قم ببناء روابط لمنتجات تقوم بالتسويق لها داخل المقال فهذا سيزيد من نسبة وصولك بمساعدة سارق المحتوى.
RSS Footer 

هنا يمكنك أن تُبدع وتضع روابطك وحقوقك الخاصة، هناك الكثير من الاضافات التي تتيح لك إضافة الحقوق على خلاصة موقعك ومنها إضافة Yoast SEO.

 

[box type=”info” align=”alignright” class=”” width=””]هذه كانت أفضل الأساليب لمواجهة سرقة المواضيع المستمرة على موقعك تم شرحها وتفصيلها لأول مرة على الويب العربي، شارك المقال حتى يصل لأكبر عدد ممكن من أصحاب المواقع، واترك لنا تعليقك في حال كان لديك إستفسار أو إنتقاد. [/box]