تضيف Google فحص llms.txt إلى Chrome Lighthouse
تتحقق الآن عمليات تدقيق Lighthouse “Agentic Browsing” الجديدة من Google من وجود ملف llms.txt. تعمل وثائق Lighthouse التجريبية الجديدة على تأطير llms.txt كإشارة لقابلية الاكتشاف والكفاءة لعملاء الذكاء الاصطناعي، وليس توجيهًا تقليديًا للزحف.
تعد عمليات التدقيق جزءًا من فئة “التصفح الوكيل” الناشئة في Chrome، والتي تعمل على تقييم ما إذا كانت المواقع مصممة للتفاعل مع الآلة.
تأتي هذه الوثيقة بعد أقل من أسبوع من نشر Google إرشادات جديدة حول تحسين ميزات بحث الذكاء الاصطناعي مثل AI Overviews وAI Mode، والتي قالت فيها إنك لا تحتاج إلى ملفات llms.txt في قسم مخالف للأساطير في دليلها الجديد حول تحسين ميزات الذكاء الاصطناعي التوليدية.
ما يتحقق المنارة الآن. تقوم فئة التصفح الوكيل في Lighthouse بتقييم “مدى جودة إنشاء موقعك للتفاعل مع الآلة” باستخدام عمليات التدقيق الحتمية، وفقًا لوثائق Google. من بين الشيكات:
التكامل مع WebMCP.
سلامة شجرة الوصول.
استقرار التخطيط من خلال CLS.
وجود ملف llms.txt.
يتحقق Lighthouse من “وجود ملخص يمكن قراءته آليًا في جذر النطاق”. أوضحت Google أيضًا سبب أهمية الملف للوكلاء:
“بدون llms.txt، قد يقضي الوكلاء وقتًا أطول في الزحف إلى الموقع لفهم بنيته عالية المستوى ومحتواه الأساسي.”
لا تنتج فئة التدقيق درجة Lighthouse التقليدية (0-100). وبدلاً من ذلك، تعرض Google نسبة نجاح جزئية إلى جانب عمليات التحقق من النجاح/الفشل المرتبطة بإشارات جاهزية الوكيل.
التوتر. لا تتعارض وثائق Lighthouse الجديدة بشكل مباشر مع نصيحة Google بشأن تحسين موقع الويب الخاص بك لميزات الذكاء الاصطناعي التوليدية لأن عمليات التدقيق هذه تركز على وكلاء الذكاء الاصطناعي وأدوات المتصفح، وليس تصنيفات بحث Google. ومع ذلك، فإن رؤية llms.txt مذكور في عمليات التحقق من جاهزية Chrome قد يؤدي إلى إعادة التفكير في بعض مُحسنات محركات البحث (SEO) في الشكوك السابقة حول الملف.
تحسين المحرك الوكيل. تتوافق عمليات تدقيق Lighthouse أيضًا مع الأفكار التي أوضحها آدي عثماني، مدير هندسة Google Cloud AI، في أبريل حول Agentic Engine Optimization. وقال عثماني إن عملاء الذكاء الاصطناعي الذين لديهم نوافذ سياقية محدودة قد يقطعون صفحات طويلة أو يفوتون معلومات مهمة مدفونة بعمق في المحتوى. ومن توصياته:
البنية الدلالية الأنظف.
محتوى فعال للرمز.
تسليم تخفيض السعر.
طبقات اكتشاف llms.txt.
ملفات إشارات القدرة مثل AGENTS.md.
تحسين محركات البحث مقابل llms.txt. إليك بالضبط ما توصي به Google في بحث الذكاء الاصطناعي التوليدي Mythbusting: ما لا تحتاج إلى القيام به:
ملفات LLMS.txt والعلامات “الخاصة” الأخرى: لا تحتاج إلى إنشاء ملفات جديدة قابلة للقراءة آليًا، أو ملفات نصية تعمل بالذكاء الاصطناعي، أو ترميز، أو Markdown لتظهر في بحث الذكاء الاصطناعي الإنتاجي. لاحظ أن Google قد يكتشف العديد من أنواع الملفات ويزحف إليها ويفهرسها بالإضافة إلى HTML على موقع الويب: وهذا لا يعني أنه يتم التعامل مع الملف بطريقة خاصة.
إليك ما قاله جون مولر من Google عن استخدام Google لملفات llms.txt، ردًا على سؤال ليلي راي له على Bluesky “مرحبًا @johnmu.com – إذا كنت تستطيع الإجابة، يشير العديد من الأشخاص إلى المفارقة المتمثلة في أن Google تستخدم ملفات LLMs.txt، بالإضافة إلى صفحات تخفيض السعر، على الرغم من قولك أيضًا إن هذه الأشياء ليست ضرورية للأداء في البحث. هل يمكنك مشاركة الأسباب التي قد تدفع Google إلى نشر هذه الملفات، إن لم يكن لجعل الزحف إلى تلك الصفحات/المواقع أسهل بالنسبة للعملاء؟ (أنا بالتأكيد سأتلقى هذا السؤال كثيرًا قريبًا!)”:
الإجابة المختصرة هي أن الأمر لم يتم من أجل البحث. هناك ما هو أكثر في مواقع الويب من مجرد تحسين محركات البحث :-).
الإصدار الأطول والأكثر دقة هو أنه يستحق فصل “الاكتشاف” (العثور على موقع الويب أو الصفحات باستخدام محرك بحث عالمي) مقابل “الوظيفة” (ربما يكون هناك مصطلح أكثر دقة لهذا، ولكن بشكل أساسي: بمجرد عثور شخص ما على الصفحة، مساعدته على القيام بالمهمة التي يريد القيام بها على أفضل وجه).
ربما يكون هذا مشابهًا لعبارات الحث على اتخاذ إجراء (CTA) على الصفحات التقليدية؟ أنت لا “تقوم بذلك” من أجل تحسين محركات البحث (يتم العثور عليه)، ولكن إذا كنت مسؤولاً عن موقع الويب بشكل عام، فإن ضمان “معدل اكتشاف” مرتفع (SEO) بالإضافة إلى معدل تحويل مرتفع يعد مفيدًا لتبرير عملك.
للعودة إلى موقع Developers.google.com، أصبح ترميز الذكاء الاصطناعي شائعًا للغاية، ويمكن أن تكون أنظمة الترميز هذه (على ما أعتقد) فعالة ودقيقة مع التعليمات البرمجية التي تنتجها إذا كان بإمكانها قراءة/تحليل المواد المرجعية بسهولة، مثل وثائق المطورين.
في هذه الحالات، قد يكون من المفيد منحهم طريقة لفهم سياق الوثائق التي يبحثون عنها، بالإضافة إلى نسخة مبسطة من الصفحة المرجعية (على سبيل المثال، في تخفيض السعر). بالطبع يمكنهم قراءة لغة HTML بشكل جيد، لذلك يعد هذا بمثابة عكاز مؤقت، ربما لحفظ بعض الرموز المميزة.
بالنسبة للمواقع غير المطورة، لا أعتقد أن هذا منطقي كثيرًا، حتى مع وجود المزيد من زيارات الوكلاء في المستقبل (وإذا قمت بفحص سجلاتك، فلن تحصل على الكثير من ذلك في الوقت الحالي). إن إنشاء نسخة تخفيض السعر من مواصفات الحذاء لن يجلب لك المزيد من المبيعات (المنافسون يقدرون ذلك أيضًا).
و(أعلم أنه لا أحد يقرأ حتى الآن)، إذا كنت تعتقد أن هذا مهم للتحضير عندما يكون الوكلاء في كل مكان: موقعك (جميع المواقع) لديه أشياء أكثر أهمية للقيام بها لتحسين محركات البحث بدلاً من الاستعداد لموقف مستقبلي محتمل قد يأتي أو لا يأتي. إعطاء الأولوية للاحتياجات قبل الأحلام.
ما يقول جوجل أن الوكلاء يعتمدون عليه. بخلاف llms.txt، تركز فئة Lighthouse الجديدة من Google بقوة على إمكانية الوصول واستقرار الواجهة. تقول الوثائق أن الوكلاء يعتمدون على شجرة إمكانية الوصول باعتبارها “نموذج البيانات الأساسي” الخاص بهم. تقوم المنارة على وجه التحديد بتقييم:
التسميات البرمجية للعناصر التفاعلية.
بنية شجرة إمكانية الوصول صالحة.
ما إذا كان المحتوى التفاعلي مخفيًا عن الأنظمة المساعدة.
استقرار التخطيط من خلال CLS.
تحذر Google أيضًا من أن أدوات WebMCP المسجلة ديناميكيًا وتغييرات DOM الكبيرة يمكن أن تؤثر على نتائج التدقيق.
لماذا نهتم. تقول Google أنك لا تحتاج إلى llms.txt للبحث، ولكن Chrome يتحقق الآن من وجود الملف. وفي الوقت نفسه، يبدو أن أدوات وكيل جوجل تفضل المواقع التي يسهل على الأجهزة قراءتها واستخدامها، وخاصة المواقع التي تتمتع بإمكانية وصول قوية، وتخطيطات مستقرة، ووصول واضح للوكيل.
مستند مساعدة جوجل. منارة وكيل التصفح التهديف
حفر أعمق.
تعرف على llms.txt، وهو معيار مقترح للزحف إلى محتوى موقع ويب الذكاء الاصطناعي
llms.txt ليس ملف robots.txt: إنه خريطة كنز للذكاء الاصطناعي
هل llms.txt مهم؟ قمنا بتتبع 10 مواقع لمعرفة ذلك
مهندسة برمجيات ومتخصصة في التسويق الرقمي وتحسين محركات البحث (SEO). أجمع بين الخبرة التقنية في بناء المواقع والاستراتيجيات التسويقية المبتكرةمهندسة برمجيات ومتخصصة في التسويق الرقمي وتحسين محركات البحث (SEO). أجمع بين الخبرة التقنية في بناء المواقع والاستراتيجيات التسويقية المبتكرة لمساعدة الشركات على بناء حضور رقمي قوي وتصدر نتائج البحث. مؤسسة HadDesign لتطوير الحلول الرقمية المتكاملة. لمساعدة الشركات على بناء حضور رقمي قوي وتصدر نتائج البحث. مؤسسة HadDesign لتطوير الحلول الرقمية المتكاملة.



إرسال التعليق