Item request has been placed! ×
Item request cannot be made. ×
loading  Processing Request

Cyberbullying Text Identification based on Deep Learning and Transformer-based Language Models ... : تحديد نص التنمر الإلكتروني بناءً على التعلم العميق ونماذج اللغة القائمة على المحولات ...

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • معلومة اضافية
    • بيانات النشر:
      OpenAlex
    • الموضوع:
      2024
    • Collection:
      DataCite Metadata Store (German National Library of Science and Technology)
    • نبذة مختصرة :
      In the contemporary digital age, social media platforms like Facebook, Twitter, and YouTube serve as vital channels for individuals to express ideas and connect with others. Despite fostering increased connectivity, these platforms have inadvertently given rise to negative behaviors, particularly cyberbullying. While extensive research has been conducted on high-resource languages such as English, there is a notable scarcity of resources for low-resource languages like Bengali, Arabic, Tamil, etc., particularly in terms of language modeling. This study addresses this gap by developing a cyberbullying text identification system called BullyFilterNeT tailored for social media texts, considering Bengali as a test case. The intelligent BullyFilterNeT system devised overcomes Out-of-Vocabulary (OOV) challenges associated with non-contextual embeddings and addresses the limitations of context-aware feature representations. To facilitate a comprehensive understanding, three non-contextual embedding models GloVe, ... : في العصر الرقمي المعاصر، تعمل منصات وسائل التواصل الاجتماعي مثل فيسبوك وتويتر ويوتيوب كقنوات حيوية للأفراد للتعبير عن الأفكار والتواصل مع الآخرين. على الرغم من تعزيز الاتصال المتزايد، إلا أن هذه المنصات أدت عن غير قصد إلى ظهور سلوكيات سلبية، لا سيما التنمر عبر الإنترنت. في حين أجريت أبحاث مكثفة على اللغات عالية الموارد مثل اللغة الإنجليزية، إلا أن هناك ندرة ملحوظة في الموارد للغات منخفضة الموارد مثل البنغالية والعربية والتاميلية وما إلى ذلك، لا سيما من حيث نمذجة اللغة. تتناول هذه الدراسة هذه الفجوة من خلال تطوير نظام تحديد نص التسلط عبر الإنترنت يسمى BullyFilterNeT مصمم خصيصًا لنصوص وسائل التواصل الاجتماعي، مع اعتبار اللغة البنغالية كحالة اختبار. يتغلب نظام BullyFilterNeT الذكي على تحديات المفردات (OOV) المرتبطة بالتضمينات غير السياقية ويتناول قيود تمثيلات الميزات الواعية بالسياق. لتسهيل الفهم الشامل، تم تطوير ثلاثة نماذج تضمين غير سياقية GloVe و FastText و Word2Vec لاستخراج الميزات باللغة البنغالية. يتم استخدام نماذج التضمين هذه في نماذج التصنيف، باستخدام ثلاثة نماذج إحصائية (SVM، SGD، Libsvm)، وأربعة نماذج ...
    • Relation:
      https://dx.doi.org/10.60692/7rthe-e0m14
    • الرقم المعرف:
      10.60692/y3yr6-4ea05
    • Rights:
      cc-by
    • الرقم المعرف:
      edsbas.838672AB