recent
أخبار ساخنة

جروك! Grok بوت دردشة مبني على الذكاء الاصطناعي منافس لـ ChatGPT

mikedred
الصفحة الرئيسية

Grok بوت دردشة مبني على الذكاء الاصطناعي منافس لـ ChatGPT


اذا رسميا إيلون ماسك يعلن عن Grok بوت دردشة مبني على الذكاء الاصطناعي منافس لـ ChatGPT ولديه العديد من المميزات، يقال انه تم تصميم Grok للإجابة على الأسئلة مع قليل من الذكاء ولديه نزعة متمردة، ولديه حس فكاهي!

واحدة من اهم مميزاته ان لديه القدرة على التفاعل مع ما يحدث في الوقت الفعلي عبر منصة  𝕏 (تويتر) يعني يقدر يمدلك مختصر الاحداث في الوقت الحالي، يعني وكأنوا عندك صحفي خاص بك.

حاليا الخدمة ستتوفر حصريا لمشتركي X premium Plus، المشروع يدخل ضمن شركة xAI التي تم تأسيسها من إيلون ماسك لدخول عالم الذكاء الاصطناعي.

التجارب الاولى تظهر ان المشروع سيكون منافسا شرسا لـ ChatGPT.


الإعلان عن جروك Grok !


 Grok عبارة عن ذكاء اصطناعي تم تصميمه على غرار دليل Hitchhiker's Guide to the Galaxy، وهو مصمم للإجابة على أي شيء تقريبًا، والأصعب بكثير، حتى اقتراح الأسئلة التي يجب طرحها!

 تم تصميم Grok للإجابة على الأسئلة مع قليل من الذكاء ولديه نزعة متمردة، لذا يرجى عدم استخدامه إذا كنت تكره الفكاهة!

 الميزة الفريدة والأساسية لـ Grok هي أنها تتمتع بمعرفة العالم في الوقت الفعلي عبر منصة 𝕏. كما سيجيب أيضًا على الأسئلة المثيرة التي ترفضها معظم أنظمة الذكاء الاصطناعي الأخرى.

 لا يزال Grok منتجًا تجريبيًا مبكرًا جدًا - أفضل ما يمكننا القيام به خلال شهرين من التدريب - لذا توقع أن يتحسن بسرعة مع مرور كل أسبوع بمساعدتك.

لماذا جروك Grok 

في xAI، نريد إنشاء أدوات الذكاء الاصطناعي التي تساعد البشرية في سعيها للفهم والمعرفة.

من خلال إنشاء وتحسين Grok، فإننا نهدف إلى:
  • اجمع التعليقات وتأكد من أننا نبني أدوات الذكاء الاصطناعي التي تعود بالنفع على البشرية جمعاء إلى أقصى حد. نحن نؤمن بأهمية تصميم أدوات الذكاء الاصطناعي التي تكون مفيدة للأشخاص من جميع الخلفيات والآراء السياسية. نريد أيضًا تمكين مستخدمينا من خلال أدوات الذكاء الاصطناعي الخاصة بنا، وفقًا للقانون. هدفنا مع Grok هو استكشاف وإظهار هذا النهج في الأماكن العامة.
  • تمكين البحث والابتكار: نريد أن يعمل Grok كمساعد بحث قوي لأي شخص، ويساعده على الوصول بسرعة إلى المعلومات ذات الصلة ومعالجة البيانات والتوصل إلى أفكار جديدة.
هدفنا النهائي هو أن تساعد أدوات الذكاء الاصطناعي لدينا في السعي لتحقيق الفهم.

الرحلة إلى Grok-1

المحرك الذي يعمل على تشغيل Grok هو Grok-1، وهو برنامج LLM الحدودي الخاص بنا، والذي قمنا بتطويره خلال الأشهر الأربعة الماضية. لقد مر Grok-1 بالعديد من التكرارات خلال هذه الفترة الزمنية.

بعد الإعلان عن xAI، قمنا بتدريب نموذج أولي LLM (Grok-0) مع 33 مليار معلمة. يقترب هذا النموذج المبكر من قدرات LLaMA 2 (70B) وفقًا لمعايير LM القياسية ولكنه يستخدم نصف موارده التدريبية فقط. في الشهرين الماضيين، أجرينا تحسينات كبيرة في قدرات الاستدلال والترميز مما أدى إلى Grok-1، وهو نموذج لغة متطور وأقوى بكثير، حيث حقق 63.2% في مهمة الترميز HumanEval و73% على MMLU.

لفهم تحسينات القدرات التي أجريناها مع Grok-1، أجرينا سلسلة من التقييمات باستخدام عدد قليل من معايير التعلم الآلي القياسية المصممة لقياس قدرات الرياضيات والاستدلال.
  • GSM8k: المسائل اللفظية في الرياضيات في المدرسة المتوسطة، (كوبي وآخرون. 2021)، باستخدام موجه سلسلة الأفكار.
  • MMLU: أسئلة الاختيار من متعدد متعددة التخصصات، (Hendrycks et al. 2021)، قدمت أمثلة في السياق مكونة من 5 لقطات.
  • HumanEval: مهمة إكمال كود Python، (Chen et al. 2021)، تم تقييمها بدون نتيجة لـ pass@1.
  • الرياضيات MATH : مسائل الرياضيات في المدارس المتوسطة والثانوية مكتوبة بلغة LaTeX (Hendrycks et al. 2021)، وموجهة بمطالبة ثابتة من 4 طلقات.


في هذه المعايير، أظهر Grok-1 نتائج قوية، متجاوزًا جميع النماذج الأخرى في فئة الحوسبة الخاصة به، بما في ذلك ChatGPT-3.5 وInflection-1. يتم تجاوزه فقط من خلال النماذج التي تم تدريبها باستخدام كمية أكبر بكثير من بيانات التدريب والموارد الحسابية مثل GPT-4. يوضح هذا التقدم السريع الذي نحرزه في xAI في تدريب LLMs بكفاءة استثنائية.

نظرًا لأنه يمكن العثور على هذه المعايير على الويب ولا يمكننا استبعاد أن نماذجنا قد تم تدريبها عليها عن غير قصد، فقد قمنا بتقييم نموذجنا يدويًا (وكذلك Claude-2 وGPT-4) في نهائيات المدارس الثانوية الوطنية المجرية لعام 2023 في الرياضيات، والذي تم نشره في نهاية شهر مايو، بعد أن قمنا بجمع مجموعة البيانات الخاصة بنا. ونجح جروك في الامتحان بدرجة C (59%)، بينما حصل كلود-2 على نفس الدرجة (55%)، وحصل GPT-4 على درجة B بنسبة 68%. تم تقييم جميع النماذج عند درجة حرارة 0.1 ونفس الموجه. وتجدر الإشارة إلى أننا لم نبذل أي جهد لضبط هذا التقييم. كانت هذه التجربة بمثابة اختبار "واقعي" لمجموعة بيانات لم يتم ضبط نموذجنا عليها بشكل صريح.



نقدم ملخصًا للتفاصيل الفنية المهمة لـ Grok-1 في بطاقة النموذج.


الهندسة في xAI

على حدود أبحاث التعلم العميق، يجب بناء بنية تحتية موثوقة بنفس القدر من العناية التي يتم بها بناء مجموعات البيانات وخوارزميات التعلم. لإنشاء Grok، قمنا ببناء مجموعة مخصصة للتدريب والاستدلال استنادًا إلى Kubernetes وRust وJAX.

يسير تدريب LLM مثل قطار الشحن المدوٍ للأمام؛ إذا خرجت إحدى السيارات عن مسارها، يتم سحب القطار بأكمله خارج المسار، مما يجعل من الصعب وضعه في وضع مستقيم مرة أخرى. هناك عدد لا يحصى من الطرق التي تفشل بها وحدات معالجة الرسومات: عيوب التصنيع، والاتصالات غير الدقيقة، والتكوين غير الصحيح، وشرائح الذاكرة المتدهورة، والقلب العشوائي العرضي للبت، والمزيد. أثناء التدريب، نقوم بمزامنة العمليات الحسابية عبر عشرات الآلاف من وحدات معالجة الرسومات لأشهر متتالية، وتصبح جميع أوضاع الفشل هذه متكررة بسبب الحجم. للتغلب على هذه التحديات، نستخدم مجموعة من الأنظمة الموزعة المخصصة التي تضمن تحديد كل نوع من أنواع الفشل على الفور ومعالجته تلقائيًا. في xAI، جعلنا تعظيم الحوسبة المفيدة لكل واط هو محور التركيز الرئيسي لجهودنا. على مدى الأشهر القليلة الماضية، مكنتنا بنيتنا التحتية من تقليل وقت التوقف عن العمل والحفاظ على استخدام عالي للنموذج Flop (MFU) حتى في حالة وجود أجهزة غير موثوقة.

لقد أثبت Rust أنه خيار مثالي لبناء بنية تحتية قابلة للتطوير وموثوقة وقابلة للصيانة. إنه يوفر أداءً عاليًا ونظامًا بيئيًا غنيًا ويمنع غالبية الأخطاء التي قد يجدها المرء عادةً في النظام الموزع. نظرًا لصغر حجم فريقنا، تعد موثوقية البنية التحتية أمرًا بالغ الأهمية، وإلا فإن الصيانة ستؤدي إلى حرمان الابتكار. يوفر لنا Rust الثقة بأن أي تعديل للكود أو إعادة البناء من المرجح أن ينتج برامج عمل يمكن تشغيلها لعدة أشهر مع الحد الأدنى من الإشراف.

نحن نستعد الآن للقفزة التالية في قدرات النموذج، والتي ستتطلب تنسيقًا موثوقًا لعمليات التدريب على عشرات الآلاف من المسرعات، وتشغيل خطوط أنابيب البيانات على نطاق الإنترنت، وبناء أنواع جديدة من القدرات والأدوات في Grok. إذا كان هذا يبدو مثيرًا بالنسبة لك، تقدم بطلب للانضمام إلى الفريق هنا.

البحث في xAI

نحن نمنح Grok إمكانية الوصول إلى أدوات البحث والمعلومات في الوقت الفعلي، ولكن كما هو الحال مع جميع حاملي شهادات الماجستير المدربين على التنبؤ بالرموز المميزة التالية، لا يزال بإمكان نموذجنا إنشاء معلومات خاطئة أو متناقضة. ونحن نعتقد أن تحقيق الاستدلال الموثوق به هو الاتجاه البحثي الأكثر أهمية لمعالجة القيود المفروضة على النظم الحالية. هنا، نود أن نسلط الضوء على بعض الاتجاهات البحثية الواعدة التي نحن متحمسون لها كثيرًا في xAI:

  • مراقبة قابلة للتطوير بمساعدة الأداة. ردود الفعل البشرية ضرورية. ومع ذلك، قد يكون تقديم تعليقات متسقة ودقيقة أمرًا صعبًا، خاصة عند التعامل مع تعليمات برمجية طويلة أو خطوات تفكير معقدة. يمكن أن يساعد الذكاء الاصطناعي في الإشراف القابل للتطوير من خلال البحث عن مراجع من مصادر مختلفة، والتحقق من الخطوات الوسيطة باستخدام أدوات خارجية، وطلب التعليقات البشرية عند الضرورة. نحن نهدف إلى تحقيق أقصى استفادة من وقت مدرسي الذكاء الاصطناعي لدينا بمساعدة نماذجنا.
  • التكامل مع التحقق الرسمي للسلامة والموثوقية والتأريض. لإنشاء أنظمة ذكاء اصطناعي يمكنها التفكير بعمق في العالم الحقيقي، نخطط لتطوير مهارات التفكير في مواقف أقل غموضًا وأكثر قابلية للتحقق. وهذا يسمح لنا بتقييم أنظمتنا دون ردود فعل بشرية أو تفاعل مع العالم الحقيقي. أحد الأهداف الرئيسية المباشرة لهذا النهج هو تقديم ضمانات رسمية لصحة التعليمات البرمجية، خاصة فيما يتعلق بالجوانب التي يمكن التحقق منها رسميًا لسلامة الذكاء الاصطناعي.
  • فهم السياق الطويل واسترجاعه. إن نماذج التدريب لاكتشاف المعرفة المفيدة بكفاءة في سياق معين هي جوهر إنتاج أنظمة ذكية حقًا. نحن نعمل على أساليب يمكنها اكتشاف المعلومات واسترجاعها عند الحاجة إليها.
  • متانة الخصومة. توضح الأمثلة العدائية أن القائمين على تحسين الأداء يمكنهم بسهولة استغلال نقاط الضعف في أنظمة الذكاء الاصطناعي، سواء أثناء التدريب أو وقت الخدمة، مما يتسبب في ارتكابهم لأخطاء فادحة. نقاط الضعف هذه هي نقاط ضعف طويلة الأمد في نماذج التعلم العميق. نحن مهتمون بشكل خاص بتحسين قوة LLMs ونماذج المكافآت وأنظمة المراقبة.
  • قدرات الوسائط المتعددة. حاليًا، ليس لدى جروك حواس أخرى، مثل الرؤية والصوت. ولمساعدة المستخدمين بشكل أفضل، سنقوم بتزويد Grok بهذه الحواس المختلفة التي يمكنها تمكين التطبيقات الأوسع، بما في ذلك التفاعلات والمساعدة في الوقت الفعلي.
نحن نؤمن بأن الذكاء الاصطناعي يحمل إمكانات هائلة للمساهمة بقيمة علمية واقتصادية كبيرة للمجتمع، لذلك سنعمل على تطوير ضمانات موثوقة ضد الأشكال الكارثية للاستخدام الضار. نحن نؤمن ببذل قصارى جهدنا لضمان بقاء الذكاء الاصطناعي قوة من أجل الخير.

إذا كنت تشاركنا تفاؤلنا وترغب في المساهمة في مهمتنا، تقدم بطلب للانضمام إلى الفريق هنا.

الوصول المبكر إلى Grok

نحن نعرض على عدد محدود من المستخدمين في الولايات المتحدة تجربة نموذج Grok الأولي الخاص بنا وتقديم تعليقات قيمة ستساعدنا على تحسين قدراته قبل إصداره على نطاق أوسع. يمكنك الانضمام إلى قائمة انتظار Grok هنا. يمثل هذا الإصدار الخطوة الأولى لـ xAI. وبالنظر إلى المستقبل، لدينا خريطة طريق مثيرة وسنطرح إمكانات وميزات جديدة في الأشهر المقبلة.
google-playkhamsatmostaqltradent