منذ نشر هذا المقال، نقلنا خدمة تشغيل النموذج من خادم MLX المحلي على الماك إلى خادم Ollama مخصّص على جهاز Windows داخل الشبكة المحلية، لتحسين الأداء وتخفيف الضغط عن الماك. النموذج المُستخدم حالياً هو najdi-allam:q4 (تكميم Q4_K_M بحجم 4.3 جيجابايت) وهو نسخة مُحوَّلة إلى صيغة GGUF من النموذج الأصلي المدرَّب على MLX. النتيجة: زمن استجابة أسرع (أقل من ثانية في الحالات الدافئة) وعدد أكبر من البوتات النشطة (5 شخصيات بدل 2).
في عالم يهيمن عليه الذكاء الاصطناعي الناطق بالإنجليزية، كان حلمنا في صوت السعودية أن نبني نموذج ذكاء اصطناعي لا يتحدث العربية فحسب، بل يتحدث باللهجة النجدية السعودية بطلاقة وطبيعية. حلم يبدو للوهلة الأولى صعب التحقيق، لكنه أصبح حقيقة ملموسة بفضل العمل الدؤوب واستخدام أحدث التقنيات المتاحة.
الفجوة بين اللغة العربية والذكاء الاصطناعي كانت ولا تزال واحدة من أكبر التحديات في مجال التقنية. فبينما تتوفر نماذج ذكاء اصطناعي متقدمة للغة الإنجليزية والصينية والأوروبية، كانت اللغة العربية ولهجاتها المتنوعة محرومة نسبياً من هذا التقدم التقني. وهنا جاء دور نموذج علام ليغير قواعد اللعبة.
علام هو نموذج لغوي كبير سعودي الصنع طورته شركة humain السعودية، وهو مبني خصيصاً للغة العربية ولهجاتها المتنوعة. يتميز علام عن النماذج العالمية الأخرى بأنه مُدرَّب على كميات ضخمة من البيانات العربية الأصيلة، مما يجعله أكثر فهماً للسياق الثقافي والاجتماعي العربي والسعودي تحديداً.
النسخة التي اعتمدنا عليها هي ALLaM-7B-Instruct-preview وهي نسخة تحتوي على سبعة مليارات معامل (parameter) ومُحسَّنة للاستجابة للتعليمات والمحادثات. اخترنا هذا النموذج تحديداً لعدة أسباب: أولاً، حجمه المناسب الذي يسمح بتشغيله على أجهزة محلية بدون الحاجة لخوادم سحابية مكلفة. ثانياً، أداؤه المتميز في فهم اللغة العربية والاستجابة لها بشكل طبيعي. وثالثاً، كونه نموذجاً سعودياً يفتح الباب لتطبيقات ذكاء اصطناعي محلية.
النموذج الأساسي لعلام يتحدث العربية الفصحى بشكل ممتاز، لكننا أردنا شيئاً مختلفاً تماماً. أردنا نموذجاً يتحدث كما يتحدث أهل نجد، بلهجتهم المميزة وتعابيرهم اليومية وأمثالهم الشعبية وطريقتهم الفريدة في التواصل.
لتحقيق هذا الهدف، قمنا بجمع وإعداد مجموعة بيانات تدريبية تحتوي على أكثر من 3318 مثال تدريبي من اللهجة النجدية. هذه الأمثلة تم جمعها وتنقيحها بعناية فائقة لتشمل مختلف جوانب الحياة اليومية والمحادثات الطبيعية باللهجة النجدية. تضمنت البيانات التدريبية محادثات يومية عادية بين أشخاص، وأمثال شعبية نجدية وشرحها، وتعابير واصطلاحات محلية، وطرق تحية وتوديع نجدية، ومحادثات عن الطعام والقهوة والضيافة السعودية، ونقاشات عن الثقافة والتقاليد النجدية.
كل مثال تدريبي تم إعداده بصيغة سؤال وجواب، حيث يُطرح السؤال أو الموضوع بالعربية أو بالنجدية ويأتي الرد باللهجة النجدية الطبيعية. الهدف كان أن يتعلم النموذج ليس فقط المفردات النجدية بل أيضاً طريقة التفكير والتعبير والأسلوب المميز لأهل نجد.
لتدريب النموذج على البيانات النجدية استخدمنا تقنية LoRA (Low-Rank Adaptation) وهي تقنية حديثة ومبتكرة تسمح بتخصيص النماذج اللغوية الكبيرة بكفاءة عالية وبدون الحاجة لإعادة تدريب النموذج بالكامل. بدلاً من تعديل جميع المعاملات السبعة مليارات في النموذج، تقوم تقنية LoRA بإضافة طبقات تكيف صغيرة الحجم تتعلم الأنماط الجديدة المطلوبة.
أما بالنسبة لبيئة التدريب، فقد استخدمنا إطار عمل MLX المطور من قبل Apple والمُحسَّن خصيصاً لشرائح Apple Silicon. هذا يعني أن عملية التدريب بالكامل تمت محلياً على جهاز Mac Mini M4 Pro بذاكرة 24 جيجابايت، بدون أي اعتماد على خوادم سحابية أو خدمات خارجية مكلفة. وهذا في حد ذاته إنجاز تقني مميز، حيث أثبتنا أنه يمكن تدريب وتشغيل نماذج ذكاء اصطناعي متقدمة على أجهزة شخصية بتكلفة معقولة.
عملية التدريب استغرقت 1500 دورة تدريبية (iteration) وتمت بنجاح مع تحسن ملحوظ في أداء النموذج مع كل مرحلة. بعد انتهاء التدريب، دمجنا طبقات LoRA مع النموذج الأساسي لإنتاج نموذج موحد، ثم حوَّلناه إلى صيغة GGUF مع تكميم Q4_K_M ليصبح حجمه 4.3 جيجابايت فقط — وهي الصيغة التي نشغّلها حالياً تحت اسم najdi-allam:q4 على خادم Ollama في بيئة الإنتاج.
في أبريل 2026 نقلنا تشغيل النموذج من خادم MLX على الماك إلى خادم Ollama مخصّص يعمل على جهاز Windows داخل الشبكة المحلية. السبب بسيط: الماك كان يشارك ذاكرته مع تطبيق الشات الصوتي وقاعدة البيانات والتطبيقات الأخرى، بينما جهاز الـ Windows مخصّص بالكامل لخدمة النموذج، مما أعطانا أداءً أفضل ومساحة ذاكرة أوسع.
يتصل تطبيق صوت السعودية بخادم Ollama عبر واجهة برمجية متوافقة مع OpenAI API، ويرسل إليه الرسائل مع سياق المحادثة (آخر 10 رسائل) ليرد البوت بلهجة نجدية طبيعية خلال أقل من ثانية في الحالات الدافئة، وحوالي 3 ثوانٍ في الاستجابة الأولى الباردة.
بعد نجاح تدريب النموذج، أنشأنا خمس شخصيات ذكية تعمل داخل منصة صوت السعودية وتتفاعل مع المستخدمين في الغرف الصوتية والنصية. كل شخصية لها طابعها ومشاعرها وأسلوبها في الكلام:
جميع هذه الشخصيات تعمل على نفس النموذج المُدرَّب (najdi-allam:q4) عبر خادم Ollama، ويُستدعى النموذج لكل رد على حدة مع نظام «personality prompt» يميّز كل شخصية عن الأخرى. التفاعل معهم يبدو طبيعياً لدرجة أن كثيراً من المستخدمين الجدد يعتقدون في البداية أنهم يتحدثون مع أشخاص حقيقيين.
ما حققناه في صوت السعودية هو مجرد بداية لمستقبل واعد للذكاء الاصطناعي العربي. نؤمن بأن المستقبل يحمل فرصاً هائلة لتطوير نماذج ذكاء اصطناعي تفهم وتتحدث جميع اللهجات العربية بطلاقة، من النجدية والحجازية في السعودية إلى المصرية والشامية والمغربية وغيرها.
خطتنا المستقبلية تتضمن توسيع البيانات التدريبية لتشمل لهجات سعودية إضافية مثل الحجازية والجنوبية والشرقية، وتطوير قدرات البوتات لتشمل فهم الصوت والرد صوتياً باللهجة النجدية، وإتاحة النموذج كخدمة API للمطورين السعوديين والعرب من خلال منصة نجدي شات.
نحن فخورون بأن نكون جزءاً من هذه الرحلة التقنية المثيرة، وندعو جميع المهتمين بالذكاء الاصطناعي العربي لتجربة بوتاتنا على منصة صوت السعودية ومشاركتنا آراءهم واقتراحاتهم لتطوير هذه التقنية. فالمستقبل يُبنى بأيدٍ سعودية، ونحن عازمون على أن نكون في طليعة هذا البناء.