Google-Currents-Featured-300x300

كيفية تعامل Google مع الملفات غير النصية



 

السلام عليكم

 

من المهم جداً أن نتعلم كيفية تعامل جوجل مع الملفات غير النصية لذلك قررنا وضع شرح شامل موثق من جوجل يتطرق إلى هذا الموضع :

 

يستطيع محرك بحث Google فهرسة معظم أنواع الصفحات والملفات (قائمة مفصلة).

ومع ذلك، تعتمد محركات البحث بوجه عام على النصوص. وهذا يعني أنه يلزمك وضع محتوى موقعك في تنسيق نصي كي يتم الزحف إليه وفهرسته. (بات بإمكان محرك بحث Google الآن فهرسة محتوى نصي مضمَّن في ملفات فلاش، ولكن قد يتعذر على محركات البحث الأخرى القيام بذلك.)

 

وهذا لا يعني أنك لا تستطيع تضمين محتوى غني بالوسائط مثل فلاش وSilverlight أو مقاطع الفيديو داخل موقعك؛ بل يعني فقط أن أي محتوى تضمِّنه في هذه الملفات يجب أن يكون متاحًا أيضًا بتنسيق نصي، وإلا فلن تتمكن محركات البحث من الوصول إليه. تركز الأمثلة الموضحة أدناه على الأنواع الأكثر شيوعًا للمحتوى غير النصي، مع ملاحظة تشابه الإرشادات بالنسبة إلى أية أنواع أخرى: فالفكرة هي تقديم مكافِئات نصية لكل ملفات المحتوى غير النصي.

 

فهذا الأمر لن يزيد فقط من قدرة Googlebot على الزحف إلى محتوى موقعك وفهرسته بنجاح، بل إنه سيزيد أيضًا من إمكانية الوصول إلى هذا المحتوى. فكثير من الأشخاص كالذين يعانون من إعاقات بصرية مثلاً، أو الذين يستخدمون برامج قراءة الشاشة، أو من لديهم اتصالات ذات سعة منخفضة للنطاق الترددي، لا يستطيعون رؤية الصور في صفحات الويب، وبالتالي فتقديم مكافِئات نصية سيزيد من جمهورك.

فلاش

يتمكن Googlebot من فهرسة تقريبًا أي نص يمكن أن يراه أحد المستخدمين أثناء تفاعله مع ملف Flash SWF على موقعك، ويمكن استخدام هذا النص لإنشاء مقتطف أو مطابقة عبارة طلب البحث في عمليات البحث في Google. علاوة على ذلك، يتمكن Googlebot أيضًا من اكتشاف عناوين URL في ملفات SWF (على سبيل المثال، الروابط للصفحات الأخرى على موقعك) وتتبع هذه الروابط.

 

ويتم الزحف إلى ذلك المحتوى وفهرسته بنفس الطريقة المتّبعة في الزحف إلى أي محتوى آخر وفهرسته على موقعك—كما أنك لست بحاجة إلى اتخاذ أي إجراء خاص. ومع ذلك، نحن لا نضمن الزحف إلى كل المحتوى وفهرسته، سواء كان محتوى فلاش أو غيره.

 

عندما يحمّل ملف SWF محتوى من ملف آخر — سواء كان ذلك ملف نصي أو ملف HTML أو ملف XML أو ملف SWF آخر وما إلى ذلك — يتمكن Google من فهرسة هذا المحتوى الخارجي أيضًا، وإقرانه بكل من ملف SWF الرئيسي وأية مستندات أخرى تتضمنه.

 

نحن نعمل بصفة مستمرة على تحسين فهرسة ملفات فلاش، ولكن ما زالت هناك بعض القيود. فعلى سبيل المثال، يتعذر علينا حاليًا فهرسة المحتوى اللغوي ثنائي الاتجاه (كالعبرية والعربية مثلاً) في ملفات فلاش.

 

لاحظ أنه على الرغم من استطاعة محرك بحث Google فهرسة محتوى ملفات فلاش، إلا أنه قد يتعذر على محركات البحث الأخرى القيام بذلك. لذا، نوصي باستخدام تقنيات الوسائط المتعددة التفاعلية مثل Flash بشكل أساسي لأغراض التزيين، وبدلاً من ذلك استخدم صيغة HTML للمحتوى والتنقل.

 

يجعل هذا الأمر موقعك أكثر توافقًا مع برامج زحف الويب، كما يجعله أكثر قابلية لوصول الجمهور إليه، بما في ذلك، على سبيل المثال، القراء ذوو الإعاقات البصرية الذين يحتاجون إلى استخدام برامج لقراءة الشاشة، أو الذين يستخدمون متصفحات غير قياسية أو ذات إصدارات أقدم، أو من لديهم اتصالات ذات سعة نطاق محدودة أو منخفضة كالهواتف النقالة أو أجهزة الجوال. هل تريد ميزة أخرى؟ يتيح استخدام صيغة HTML من أجل التنقل للمستخدمين إنشاء إشارات مرجعية للمحتوى وإرسال روابط مباشرة في رسائل البريد الإلكتروني.

 

يمكنك أيضًا التفكير في استخدام sIFR (تقنية Inman المعيارية لاستبدال محتوى فلاش). وتقنية sIFR (التي تُعد مشروعًا مفتوح المصدر) تتيح لمشرفي المواقع استبدال عناصر نصية بتنسيقات فلاش المكافئة لها. وباستخدام هذا الأسلوب، يتم عرض المحتوى والتنقل فيه عبر كائن فلاش مضمن، إلا أنه لأن المحتوى مضمن في مصدر HTML، يستطيع أي شخص من غير مستخدمي فلاش قراءة هذا المحتوى (بما في ذلك محركات البحث).

 

يمكنك أيضًا تحسين فهرسة تطبيق الفلاش أو الوسائط المتعددة التفاعلية من خلال التوافق مع نظام زحف AJAX في Google. ويعمل هذا النظام مع جافا سكريبت كما يعمل أيضًا مع فلاش وأي تقنية أخرى بالمتصفح.

 

Silverlight وتنسيقات وسائط غنية أخرى

يستطيع محرك بحث Google الزحف إلى المحتوى النصي لملفات فلاش وفهرستها، ولكن ما زالت تواجهنا بعض المشكلات في الوصول إلى محتوى بعض تنسيقات الوسائط الغنية الأخرى مثل Silverlight. وتنسيقات الوسائط الغنية هذه مرئية بطبعها، وهو ما قد يسبب بعض المشكلات لبرنامج Googlebot. فعلى عكس بعض العناكب الأخرى على الإنترنت، يستطيع Googlebot قراءة بعض ملفات الوسائط الغنية واستخلاص النص والروابط منها، ولكن يتعذر عليه استخلاص البنية والسياق. غالبًا ما يضمّن أيضًا مصممو الوسائط الغنية المحتوى في شكل رسوم جرافيك، ولأنه يتعذر على محرك بحث Google كشف الكلمات المضمنة في تلك الرسوم، فقد يفقد كلمات رئيسية مهمة. بمعنى آخر، حتى إن استطعنا الزحف إلى محتوى موقعك وتم تضمينه في فهرسنا، فربما يكون هذا المحتوى غير مكتمل أو به جزء مفقود من النص أو الروابط.

 

 

فيديو

لا يستطيع Googlebot الزحف إلى محتوى ملفات الفيديو، لذلك فمن المهم أن تقدم معلومات عن ملفات الفيديو التي تضمنها. راعِ إنشاء نسخة نصية من ملف الفيديو الذي تريد تضمينه، أو قدم وصفًا تفصيليًا للفيديو المضمن في محتوى HTML. إذا كان لديك محتوى فيديو، فيمكنك استضافته على خدمة فيديو Google، أو YouTube أو عدد آخر من مزودي خدمة استضافة محتوى الفيديو. ويستطيع القائمون بعمليات البحث مشاهدة الفيديو على فيديو Google أو YouTube مباشرةً من صفحة نتائج بحث Google.

 

إطارات IFrame

يتم استخدام إطارات IFrame أحيانًا لعرض المحتوى على صفحات الويب. وقد لا تتم فهرسة المحتوى المعروض من خلال إطارات iFrame، كما أنه قد لا يكون متاحًا للعرض ضمن نتائج بحث Google. يُوصى بتجنب استخدام إطارات iFrame لعرض المحتوى. وإذا أدرجت إطارات iFrame، فاحرص على توفير روابط نصية إضافية إلى المحتوى الذي يتم عرضه من خلالها، بحيث يتمكن Googlebot من الزحف إلى هذا المحتوى وفهرسته.

 

أفضل الممارسات

إذا كنت تخطط لاستخدام وسائط غنية على موقعك، فإليك بعض التوصيات التي يمكن أن تساعد في منع حدوث المشكلات.

  • جرِّب استخدام الوسائط الغنية عند الضرورة فقط. نوصي باستخدام تنسيق HTML للمحتوى والتنقل.
  • قدم إصدارات نصية من الصفحاتغالبًا ما يتم استخدام Silverlight كشاشة بداية على الصفحة الرئيسية، حيث يتم عمل مقدمة وسائط غنية لعنوان URL الجذر لموقع الويب والذي يرتبط بمحتوى HTML على الموقع. وإذا استخدمت هذا الأسلوب على موقعك، فتأكد من توفير رابط HTML عادي على هذه الصفحة الافتتاحية يربط المستخدم بصفحة نصية يستطيع المستخدم (أو Googlebot) التنقل من خلالها عبر موقعك دون الحاجة إلى استخدام الوسائط الغنية.