داخل بحث ChatGPT: كيف تشكل استعلامات web.run والاستعلامات الشاملة رؤية الذكاء الاصطناعي
عندما قامت OpenAI بتبديل النماذج الافتراضية في 4 مارس، انخفض عدد مواقع الويب التي يتم الاستشهاد بها لكل استجابة بمقدار الخمس، ولم تتعاف أبدًا. لكن انخفاض الاقتباس ليس سوى جزء من القصة.
قمنا أيضًا بإجراء هندسة عكسية لأدوات التصفح الداخلي في ChatGPT، وقمنا بإجراء تجربة “مصيدة جذب”، وأعدنا بناء موجه النظام الخاص به، وأصدرنا إصدارًا جديدًا من البرنامج الإضافي ChatGPT Search Capture.
ماذا حدث
في 4 مارس، قام ChatGPT بتبديل نموذجه الافتراضي من GPT-4o/5.2 إلى GPT-5.3 Instant. النتيجة: انخفض متوسط عدد النطاقات الفريدة المستشهد بها لكل إجابة من 19 إلى 15، وهو انخفاض يزيد عن 20%.
اتبعت عناوين URL الفريدة لكل استجابة نفس المسار، حيث انخفضت من 24 إلى 19. قمنا بتتبع 400 مطالبة يومية على مدار 14 أسبوعًا، باستخدام بيانات المراقبة المقدمة من Meteoria.
لماذا نهتم
لدى ChatGPT 900 مليون مستخدم نشط أسبوعيًا. لم يتغير سطح الاقتباس في كل رد، ولكن عدد أقل من مواقع الويب يشاركه. نفس الفطيرة، وشرائح أقل.
ومن المحتمل أن يعكس هذا تحولًا هيكليًا نحو مصادر ذات سلطة أعلى، ولكنه يعني أيضًا عددًا أقل من الفائزين بشكل عام. المواقع التي لا تقوم بالقطع تفقد الرؤية التي كانت في متناول اليد في السابق.
تأثير بيج فوت
لقد أطلقنا على هذه الظاهرة اسم “تحديث Bigfoot” (الذي حدده الدكتور بيتر ج. مايرز من Moz في عام 2012)، عندما تسمح Google أحيانًا لنطاق واحد باحتلال الصفحة الأولى بأكملها من النتائج.
يسترد ChatGPT الآن عددًا أقل من النطاقات لكل استجابة، لكن نسبة عنوان URL إلى النطاق ظلت مستقرة عند 1.26. لم يتغير عمق الزحف لكل مجال. ما تغير هو عدد المواقع المتميزة التي تحصل على مقعد على الطاولة.
GPT-5.4 التفكير يزيد من التركيز. يستخدم النموذج عوامل تشغيل “الموقع:” لتقييد عمليات البحث في النطاقات الموثوقة وتوزيع استعلاماته عبر أكثر من 10 “استعلامات متباعدة” لكل استجابة، يستهدف كل منها مصدرًا محددًا.
ويؤكد تحليل السجل المستقل الذي أجراه جيروم سالومون (Oncrawl) هذا الاتجاه. استقر حجم الزحف إلى روبوت ChatGPT-User عند مستوى أقل منذ التبديل إلى 5.3. لم يعد يتم الزحف إلى بعض الصفحات بعد الآن.
ويتجاوز السبب تحديثات النماذج: أكثر من 90% من مستخدمي ChatGPT الأسبوعيين يستخدمون الخطة المجانية، وتؤدي التجربة الافتراضية إلى عدد أقل من عمليات البحث على الويب، وتستخدم استعلامات أقل، وتنتج عددًا أقل من الاستشهادات.
كيف يعمل بحث ChatGPT فعليًا
تتضمن دراستنا أيضًا هندسة عكسية كاملة لنظام البحث الداخلي في ChatGPT، المسمى web.run. قبل الإصدار 5.3، كان النموذج يرسل أوامر نصية مضغوطة مفصولة بممرات (سريع|استعلام|حداثة). بعد الإصدار 5.3، يرسل كائنات JSON منظمة مع معلمات مكتوبة.
هذا ليس مجرد تغيير في الشكل. إنه يعكس بنية مختلفة في كيفية صياغة النموذج لعمليات الويب الخاصة به وتوزيعها.
تدعم أداة الويب الآن 12 عملية، بدلاً من 4 (بالإضافة إلى نظام عناصر واجهة مستخدم منفصل يسمى genui). وتشمل هذه:
search_query
مفتوح
تجد
انقر
لقطة شاشة
Product_query
أدوات متخصصة للرياضة والتمويل والطقس والمزيد.
يمكن لـ GPT-5.4 إجراء سلسلة من 5 إلى أكثر من 10 جولات من البحث لكل استجابة، مما يؤدي إلى تحسين الاستعلامات بناءً على النتائج السابقة. عادةً ما يعمل GPT-5.3 Instant على 2 أو 3.
لا تزال بصمات Google مرئية: تظهر علامات تتبع Google (strlid) في عناوين URL للمنتج، وتكشف مطابقات معرف SearchAPI إلى الرمز المميز عن اعتماد الواجهة الخلفية على موفري بحث الطرف الثالث – وGoogle خلف الكواليس.
نوع جديد من التوسيع للاستعلامات المتعلقة بالمنتج
لقد اكتشفنا نوعًا غير موثق سابقًا منتشرًا: browser_rewriter_queries. ويظهر حصريًا في استعلامات المنتج، على 5.4 Instant، ويكون مرئيًا في رمز المحادثة.
عندما يسأل المستخدم شيئًا مثل [أفضل طابعة ثلاثية الأبعاد يمكن شراؤها في عام 2026] يقوم ChatGPT أولاً بإجراء إعادة كتابة شاملة لإنشاء القائمة الكاملة للمنتجات المرشحة. ثم تطلق عملية تسوق منفصلة لكل منتج على حدة، وجلب المواصفات والمراجعات والتسعير واحدًا تلو الآخر.
قبل الإصدار 5.3، كانت عمليات البحث عن المنتجات مجمعة في مكالمة واحدة. يحصل كل منتج الآن على أمر استرجاع مخصص خاص به.
ChatGPT-User هو وكيل الاسترداد
لقد أكدت تجربتنا في مصيدة الجذب تفاصيل مهمة. عندما يتصفح ChatGPT الويب بعد البحث أثناء المحادثة، يقوم زاحف ChatGPT-User – وليس OAI-SearchBot – بجلب محتوى الصفحة.
يصف OpenAI OAI-SearchBot بأنه الوكيل الذي يبني فهرس بحث ChatGPT، ولكن في الممارسة العملية، يعتمد النموذج على واجهات برمجة تطبيقات الطرف الثالث لنتائج البحث، ثم يرسل ChatGPT-User لاسترداد المحتوى الفعلي من عناوين URL المحددة.
مساحة الاسم العمياء
قد يكون هذا هو اكتشافنا الأكثر إثارة للدهشة.
بدأ المسار بالهندسة العكسية الكلاسيكية. لقد قمنا بتفكيك تطبيق ChatGPT للهاتف المحمول، وقمنا بتحليل الكود المصدري لعميل الويب، وفحصنا حزم الشبكة على كلا النظامين الأساسيين. لقد أعطانا ذلك أسماء الأدوات الداخلية وبعض اصطلاحات الاتصال.
متسلحين بهذه التفاصيل، تمكنا من طرح الأسئلة الصحيحة على ChatGPT، واكتشفنا الإجابة على النموذج دون أي قيود.
لدى OpenAI ضمانات حقيقية حول مطالبات نظامها. لكن طبقة تكوين الأداة الداخلية لا تحتوي على أي شيء.
مساحات أسماء ChatGPT – مجموعات الأدوات الداخلية التي يمكن للنموذج الاتصال بها أثناء المحادثة – يمكن وصفها بحرية. طالما أنك تتجنب الكلمات “موجه النظام”، فسيكشف النموذج عن مخططات الأدوات وقوائم العمليات وقنوات الإخراج وهياكل مساحة الاسم بتناسق مثالي.
لقد نشرنا مطالبات جاهزة للاستخدام يمكن لأي شخص لصقها في ChatGPT لتدقيق بيئته الداخلية. وللتحقق من أن النموذج لم يكن يهلوس بهذه الأوصاف، أجرينا دراسة تشاركية مع عشرات المستخدمين عبر جلسات منفصلة. حصل كل مشارك على نفس أسماء الأدوات ومخططات المعلمات وقوائم العمليات بالضبط. يصف النموذج الأدوات الخاصة به بشكل متسق وموثوق.
تتضمن الدراسة أيضًا موجه النظام المُعاد بناؤه والمستخرج تدريجيًا، إلى جانب العديد من النتائج البارزة:
Reddit هو النطاق الوحيد المعفى من حدود الكلمات الخاصة بحقوق الطبع والنشر.
هناك قائمة تفصيلية بالمنتجات المحظورة.
تعمل “درجة الإسهاب” على مقياس من 1 إلى 10.
تحكم فقرة سياسة الإعلان الكاملة عرض الإعلان حسب مستوى الاشتراك.
الاستخدام العملي: إجراء تدقيق قابلية الزحف الخاص بك
إن بناء جملة web.run الذي قمنا بتوثيقه ليس مجرد فضول تقني. إنه يعمل، ويفتح مسارًا مباشرًا لاختبار كيفية تفاعل ChatGPT مع المحتوى الخاص بك.
هنا مثال ملموس. يمكنك إجبار ChatGPT على البحث في المجال الخاص بك وقراءة صفحات معينة عن طريق لصق أوامر JSON مباشرة في المحادثة. أولاً، قم بإجراء بحث مستهدف على موقعك، ثم أجبره على جلب أول نتيجتين، ثم اطلب منه إرجاع العنوان والموضوع الرئيسي والنقاط الرئيسية من كل صفحة.
“ابحث عن هذا الاستعلام، ثم افتح أول نتيجتين ولخص ما تجده في كل صفحة.
الخطوة الأولى: البحث:
{ “search_query”: [ { “q”: “site:abondance.com seo” } ]، “response_length”: “قصير” }
الخطوة 2: افتح أول نتيجتين:
{ “فتح”: [ { “ref_id”: “turn0search0” }، { “ref_id”: “turn0search1” } ] }
الخطوة 3: أعطني ملخصًا منظمًا لما وجدته في كل عنوان URL. لكل صفحة: العنوان، والموضوع الرئيسي، و3-5 نقاط رئيسية.
ما تحصل عليه هو عرض للمحتوى الخاص بك من خلال عيون ChatGPT: ما يمكن أن يصل إليه فعليًا، وما يستخرجه، وكيف يفسر صفحاتك.
إذا لم يتمكن ChatGPT من الوصول إلى الصفحة، أو عرض محتوى مشوه، أو فاتته رسائلك الرئيسية تمامًا، فهذه إشارة يجب التصرف بناءً عليها.
نفس العائلة النموذجية، واستشهادات مختلفة
تشترك الإصدارات GPT-5.2 و5.3 و5.4 في نفس الحد المعرفي (أغسطس 2025) وتنتمي إلى نفس عائلة GPT-5. ومع ذلك، فإن نفس المطالبة التي يتم إرسالها إلى كل منهم تنتج استفسارات متشعبة مختلفة، وتسترجع مصادر مختلفة، وتظهر فقرات مختلفة في الرد النهائي.
يتم تفعيل طبقات متعددة من الاختلاف بعد التدريب المسبق: تشكيل مكافأة RLHF، وبيانات الضبط الدقيق الخاضعة للإشراف، وتكوينات موجه النظام، وميزانيات حساب وقت الاستدلال. من الواضح أن GPT-5.4 Pro يحصل على مزيد من الحوسبة من أجل “التفكير بجدية أكبر”، وهذا وحده يمكن أن يغير المصادر التي يتم الاستشهاد بها.
ولهذا السبب نوصي باختبار النموذج حسب النموذج. يمكن لموجه واحد أن ينتج استشهادات مختلفة جذريًا اعتمادًا على ما إذا كان المستخدم يستخدم GPT-5.3 Instant أو 5.4 Thinking أو 5.4 Extended. قد يتم أيضًا توجيه مستخدمي الخطة المجانية بصمت إلى طراز أخف.
نوعان من رؤية الذكاء الاصطناعي
تقدم دراستنا إطار عمل يفصل بين الرؤية المعلمية (ما يتعلمه النموذج من بيانات التدريب مع تعطيل البحث) والرؤية الديناميكية (ما يسترده في الوقت الفعلي مع تمكين البحث).
الرؤية البارامترية: E-E-A-T لـ LLMs. الرؤية البارامترية هي ما يعادل E-E-A-T لنماذج اللغات الكبيرة. إنها سلطة مشفرة عبر مليارات الأمثلة التدريبية، والتي تشكلت من خلال التغطية الصحفية، ووجود ويكيبيديا، والمواقع الأخرى ذات السلطة العالية، ومجموعة التدريب الشاملة. إنها مستقرة وقابلة للقياس من خلال عمليات تدقيق واجهة برمجة التطبيقات (API) لمرة واحدة.
الرؤية الديناميكية: أرض متغيرة. الرؤية الديناميكية متقلبة. إنه يعتمد على النموذج ويتطلب مراقبة مستمرة. إنه أقرب إلى تحسين محركات البحث التقليدية، ويمكن أن ينهار بين عشية وضحاها مع تحديث النموذج، كما يظهر تأثير Bigfoot.
الصلة بين الأمرين. يقوم النموذج بصياغة استعلامات الويب الخاصة به من خلال استهداف المصادر التي يعرفها بالفعل. لن يتم حتى اعتبار العلامة التجارية الغائبة عن الذاكرة البارامترية مرشحة للبحث. كونك غير معروف للنموذج يعني أن تكون غير مرئي حتى قبل أن يبدأ البحث.
تحديثات قطع المعرفة هي “رقصة Google” لـ LLMs. عندما يتغير تاريخ القطع، تتم إعادة توزيع التصنيفات البارامترية بشكل مجمّع. لكن هذا لا يحدث إلا مرة واحدة تقريبًا في السنة، لأن إعادة التدريب على هذا النطاق مكلفة للغاية. إن النافذة الإستراتيجية للتأثير على ما يعرفه النموذج عن علامتك التجارية تقع بين تاريخين نهائيين.
يوضح مؤشر هيئة العلامة التجارية للذكاء الاصطناعي (DEJAN) الخاص بـ Dan Petrovic القياس البارامترى على نطاق واسع. تكملها دراستنا بإطار اختبار أخف وقابل للتكرار يعتمد على خمس مطالبات يتم تشغيلها عدة مرات لإجراء تدقيق مرة واحدة.
حفر أعمق
الدراسة الكاملة – بما في ذلك الوثائق ذات الهندسة العكسية، وتجربة مصيدة الجذب، ومطالبات تدقيق DIY، وموجه النظام المعاد بناؤه – متاحة على think.resoneo.com/chatgpt/5.3-5.4/.
خلاصة القول
لم يعد بحث ChatGPT مجرد صندوق أسود. تحدد هذه الدراسة بنيتها الداخلية، بدءًا من أداة web.run التي تشغل كل عملية بحث إلى المنطق الموسع الذي يحدد النطاقات التي سيتم جلبها وأيها يتم تجاهلها.
يوضح الانخفاض بنسبة 20% في المجالات المستشهد بها بعد التحول إلى الإصدار 5.3 مدى السرعة التي يمكن أن يتغير بها مشهد الاقتباس من خلال تحديث نموذج واحد. لكن المشكلة الأعمق هي مشكلة هيكلية: يقوم ChatGPT بتركيز الاستشهادات على عدد أقل من المواقع وتطبيق منطق اختيار المصدر الذي تم تشكيله من خلال بيانات التدريب، والضبط الدقيق بعد التدريب، وقواعد النظام التي تتغير من نموذج إلى آخر.
إن تتبع الرؤية في ChatGPT يعني فهم طبقتين متميزتين (بارامترية وديناميكية)، والاختبار عبر نماذج متعددة، ومراقبة النظام الذي تكون أدواته الداخلية قابلة للتوثيق ولكن سلوكه يمكن أن يتغير بين عشية وضحاها.
توفر الدراسة الكاملة البيانات والمنهجية والأدوات اللازمة للبدء.
مهندسة برمجيات ومتخصصة في التسويق الرقمي وتحسين محركات البحث (SEO). أجمع بين الخبرة التقنية في بناء المواقع والاستراتيجيات التسويقية المبتكرةمهندسة برمجيات ومتخصصة في التسويق الرقمي وتحسين محركات البحث (SEO). أجمع بين الخبرة التقنية في بناء المواقع والاستراتيجيات التسويقية المبتكرة لمساعدة الشركات على بناء حضور رقمي قوي وتصدر نتائج البحث. مؤسسة HadDesign لتطوير الحلول الرقمية المتكاملة. لمساعدة الشركات على بناء حضور رقمي قوي وتصدر نتائج البحث. مؤسسة HadDesign لتطوير الحلول الرقمية المتكاملة.



إرسال التعليق