ملف:RLHF diagram.svg

حجم معاينة PNG لذلك الملف ذي الامتداد SVG: ٥١٢ × ٣٦٦ بكسل. الأبعاد الأخرى: ٣٢٠ × ٢٢٩ بكسل | ٦٤٠ × ٤٥٨ بكسل | ١٬٠٢٤ × ٧٣٢ بكسل | ١٬٢٨٠ × ٩١٥ بكسل | ٢٬٥٦٠ × ١٬٨٣٠ بكسل.

الملف الأصلي (ملف SVG، أبعاده ٥١٢ × ٣٦٦ بكسل، حجم الملف: ١٧٧ كيلوبايت)

هذا الملف من ويكيميديا كومنز ويمكن استخدامه بواسطة المشاريع الأخرى. الوصف على صفحة وصف الملف هناك معروض بالأسفل.

ملخص

الوصفRLHF diagram.svg	English: This is a high-level overview of reinforcement learning from human feedback, including training an initial supervised model, collecting human feedback, training a reward model, and using it to align the initial model.
التاريخ	١٤ مارس ٢٠٢٤
المصدر	عمل شخصي
المؤلف	PopoDameron

ترخيص

أنا، صاحب حقوق التأليف والنشر لهذا العمل، أنشر هذا العمل تحت الرخصة التالية:

هذا الملفُّ مُرخَّصٌ برخصة المشاع الإبداعي الدَّوليَّة المُلزِمة بنسب العمل إلى مُؤَلِّفه وبترخيص المُشتقَّات بالمثل 4.0.

يحقُّ لك:

مشاركة العمل – نسخ العمل وتوزيعه وبثُّه
إعادة إنتاج العمل – تعديل العمل

حسب الشروط التالية:

نسب العمل إلى مُؤَلِّفه – يلزم نسب العمل إلى مُؤَلِّفه بشكل مناسب وتوفير رابط للرخصة وتحديد ما إذا أجريت تغييرات. بالإمكان القيام بذلك بأية طريقة معقولة، ولكن ليس بأية طريقة تشير إلى أن المرخِّص يوافقك على الاستعمال.
الإلزام بترخيص المُشتقات بالمثل – إذا أعدت إنتاج المواد أو غيرت فيها، فيلزم أن تنشر مساهماتك المُشتقَّة عن الأصل تحت ترخيص الأصل نفسه أو تحت ترخيص مُتوافِقٍ معه.

تاريخ الملف

اضغط على زمن/تاريخ لرؤية الملف كما بدا في هذا الزمن.

	زمن/تاريخ	صورة مصغرة	الأبعاد	مستخدم	تعليق
حالي	٢١:٢٠، ١ أبريل ٢٠٢٤		٥١٢ × ٣٦٦ (١٧٧ كيلوبايت)	wikimediacommons>PopoDameron	Clarified relationship between RM and aligned model & added description to the aligned model

استخدام الملف

الصفحة التالية تستخدم هذا الملف:

التعلم المعزز من ردود الفعل البشرية

ملف:RLHF diagram.svg

ملخص

ترخيص

الشروحات

العناصر المصورة في هذا الملف

يُصوِّر

التعلم المعزز من ردود الفعل البشرية

الصانع

قيمة ما بدون عنصر ويكي بيانات

حالة حقوق الطبع و النشر

حقوق التأليف والنشر محفوظة

الرخصة

رخصة المشاع الإبداعي الدولية الملزِمة بالنسب للمؤلف وترخيص المشتقات بالمثل وفق الإصدار 4.0

البداية

١٤ مارس 2024

نوع الوسائط

image/svg+xml

مصدر الملف

إنشاء أصيل للرافع

تاريخ الملف

استخدام الملف

قائمة التصفح

ملف:RLHF diagram.svg

ملخص

ترخيص

الشروحات

العناصر المصورة في هذا الملف

قيمة ما بدون عنصر ويكي بيانات

١٤ مارس 2024

image/svg+xml

تاريخ الملف

استخدام الملف

قائمة التصفح

بحث