روبوت محادثة “يعرف كل شيء” لكنه لا يعرف شيئًا عن عملك هو عبء لا أداة. والاسترجاع المعزّز بالتوليد (RAG) يعالج ذلك بإسناد الإجابات إلى مستنداتك. وفي العربية، إتقان ذلك يتطلّب أكثر من ترجمة مسار إنجليزي.
لماذا تفشل الروبوتات العامة مع العربية؟
العربية غنية صرفيًا — فالجذر الواحد يولّد صورًا كثيرة عبر السوابق واللواحق والتشكيل — والمحتوى الحقيقي يمزج الفصحى واللهجة الخليجية والإنجليزية. والمسارات المضبوطة للإنجليزية تقطّع هذا المحتوى وتُضمّنه بشكل رديء، فتسترجع المقاطع الخاطئة وتجيب بثقة لكن بخطأ.
كيف يُسند الـ RAG الإجابة؟
بدل الاعتماد على ذاكرة النموذج، يسترجع الـ RAG أكثر المقاطع صلة من قاعدة معرفتك، ويطلب من النموذج الإجابة من تلك المقاطع فقط، مع استشهاد يعود إلى المصدر. عندها يتوقف النموذج عن التخمين ويبدأ بالاقتباس من مستنداتك.
معالجة العربية بإتقان
- تطبيع الصور العربية والتشكيل قبل التضمين
- تضمينات تفهم دلالات العربية لا المطابقة الحرفية
- استرجاع متعدد اللغات بحيث يُظهر سؤال عربي دليلًا إنجليزيًا والعكس
- تقطيع ذكي يحترم بنية الجملة العربية
الحوكمة والاستشهادات
كل إجابة يجب أن تُظهر مصادرها، وتحترم ضبط الوصول على مستوى المستند، وتقول “لا أعرف” حين يكون الاسترجاع ضعيفًا. وهذا ما يجعل المساعد آمنًا أمام العملاء أو الموظفين.
من أين تبدأ؟
ابدأ بقاعدة معرفة واحدة محددة جيدًا — دليل سياسات، أو كتالوج منتجات، أو دليل عمليات. ويتولّى OpsRAG من LeenAI الاسترجاع العربي-الإنجليزي والاستشهادات وضبط الوصول كمشروع تجريبي مُدار. أخبرنا عن حالتك.
