الشبكات العصبية المتكررة

قالب:بطاقة طريقة علمية

الشبكات العصبية المتكررة أو شبكات ردود الفعل العصبية (بالإنكليزية: Recurrent neural network) التي هي على النقيض من شبكات feedforward، وأهم ما تتميزبه هو أن الاتصالات بين الخلايا العصبية تكون في طبقة واحدة والخلايا العصبية في نفس أو الطبقة السابقة. في الدماغ ، هذه هي الطريقة الأفضل لربط الشبكات العصبية ، خاصة في القشرة المخية الحديثة . في الشبكات العصبية الاصطناعية ، يتم استخدام الترابط المتكرر للخلايا العصبية النموذجية لاكتشاف المعلومات ذات الترميز الزمني في البيانات.^[١] ومن الأمثلة على هذه الشبكات العصبية المتكررة Hopfield العصبية المترابطة تمامًا.

أنواع مختلفة من ردود الفعل: الحافة الزرقاء ( $w_{d}$ ) مباشر ، الأخضر ( $w_{i}$ ) غير مباشر والأحمر ( $w_{l}$ ) ردود فعل جانبية.

يمكن تقسيم الشبكات المتكررة على النحو التالي:

مع ردود فعل مباشرة قالب:إنج يتم استخدام الإخراج الخاص من الخلايا العصبية كمدخل إضافي.
ردود الفعل غير المباشرة قالب:إنج يربط إخراج الخلايا العصبية مع الخلايا العصبية من الطبقات السابقة.
ردود الفعل الجانبية قالب:إنج يربط ناتج الخلايا العصبية بخلايا عصبية أخرى في نفس الطبقة.
من خلال الاتصال الكامل ، يكون لكل ناتج من الخلايا العصبية اتصال مع كل خلية عصبية أخرى.

تُستخدم الشبكات العصبية المتكررة في الممارسة العملية للمشكلات التي تتطلب معالجة التسلسلات. تشمل الأمثلة التعرف على خط اليد والتعرف على الكلام والترجمة الآلية . النوع السائد من الشبكات العصبية المتكررة هنا هو LSTMs أو المتغيرات المماثلة التي تعتمد على التغذية الراجعة المباشرة.

يمكن برمجة وتنفيذ الشبكات العصبية المتكررة في مكتبات البرامج الشائعة مثل PyTorch بسهولة في Python ثم ترجمتها إلى كود فعال باستخدام التجميع في الوقت المناسب.

تدريب الشبكات العصبية المتكررة

ليس من السهولة تدريب الشبكات العصبية الاصطناعية المتكررة باستخدام أساليب التعلم الآلي. ^[٢] لذلك فإن الأسلوب الشائع ليس تدريب الشبكة ، بل تدريب الشبكة على قراءتها. يُنظر إلى الشبكة العصبية المتكررة على أنها ما يسمى بخزان في سياق حوسبة الخزان. في حالة LSTMs ، يتم تحويل الشبكات إلى شبكة تغذية وفقًا لطول التسلسل باستخدام الانتشار العكسي عبر الوقت (انظر backpropagation) أثناء عملية التدريب. ^[٣] هذا يجعل تعقيد سلوك التعلم مشابهًا لسلوك شبكات التغذية التقليدية.

نقطة البداية للانتشار العكسي عبر الزمن هي أن دالة الخسارة الكلية للسلسلة الزمنية تتكون من $T$ خطوات الوقت والتي يمكن تمثيلها على النحو التالي:

L = \sum_{t = 1}^{T} l (y_{t}, o_{t} (θ))

و

بواسطة $l$ هي وظيفة ناتجة عن الشبكة $o_{t}$ (في الموعد $t$ ) بهدف $y_{t}$ يقارن وأين $θ$ هو متجه المعلمة الثابتة للوقت للشبكة العصبية المتكررة. يسمح الانتشار العكسي عبر الزمن بحساب المشتق الكلي (من حيث المكون) من خلال تطبيق قاعدة السلسلة $\frac{d L}{d θ_{i}}$ . منذ الإخراج $o_{t} (h_{t - 1} (θ))$ حتى من القيم $h_{t - 1}$ من الخطوة الزمنية السابقة $t - 1$ يعتمد وهذا على $θ$ ، يجب تضمين هذه الخطوات الزمنية السابقة في الاشتقاق.

يمكن أن تنشأ مشاكل في تدريب الشبكات العصبية المتكررة بسبب اختفاء التدرجات أو انفجارها. يمكن استخدام إجبار المعلم (بالإنكليزية:Teacher-Forcing) للتحايل على هذه المشكلات ، ولكن يتم إدخال مقايضة التعرض للانحياز (بالإنكليزية: Bias-Exposure tradeoff ).^[٤]

المؤلفات

أندرياس زيل: محاكاة الشبكات العصبية. تم العثور على R. Oldenbourg Verlag ، ميونيخ 1997 ، ISBN 3-486-24350-0 .

مراجع

قالب:مراجع قالب:ضبط استنادي قالب:شريط سفلي ذكاء اصطناعي

قالب:شريط بوابات

↑ قالب:استشهاد بكتاب
↑ قالب:Internetquelle قالب:استشهاد بويب
↑ قالب:Internetquelle قالب:استشهاد بويب
↑ Quantifying Exposure Bias for Open-ended Language Generation https://arxiv.org/abs/1905.10617#:~:text=The%20exposure%20bias%20problem%20refers,network%20language%20models%20(LM). قالب:Webarchive

[kruse-print-1] قالب:استشهاد بكتاب

[2] قالب:Internetquelle قالب:استشهاد بويب

[3] قالب:Internetquelle قالب:استشهاد بويب

[4] Quantifying Exposure Bias for Open-ended Language Generation https://arxiv.org/abs/1905.10617#:~:text=The%20exposure%20bias%20problem%20refers,network%20language%20models%20(LM). قالب:Webarchive

[١]

[٢]

[٣]

[٤]

الشبكات العصبية المتكررة

تدريب الشبكات العصبية المتكررة

المؤلفات

مراجع

قائمة التصفح

بحث