Item request has been placed! ×
Item request cannot be made. ×
loading  Processing Request

Detecting Favorite Topics in Computing Scientific Literature via Dynamic Topic Modeling

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • معلومة اضافية
    • بيانات النشر:
      Institute of Electrical and Electronics Engineers (IEEE), 2023.
    • الموضوع:
      2023
    • نبذة مختصرة :
      La modélisation de sujets comprend un ensemble d'algorithmes d'apprentissage automatique qui permettent d'extraire des sujets d'une collection de documents. Ces algorithmes ont été largement utilisés dans de nombreux domaines, tels que l'identification des sujets dominants dans la recherche scientifique. Cependant, les travaux traitant de ces problèmes se concentrent souvent sur l'identification de sujets statiques, fournissant des instantanés qui sont incapables de montrer comment ces sujets évoluent au fil du temps. Visant à combler cette lacune, dans cet article, nous décrivons une approche pour l'analyse et la classification dynamiques des ensembles d'articles. Ceci est accompli en interrogeant des données ouvertes de bases de données scientifiques notables via des transferts d'état de représentation et en appliquant par la suite des pratiques de gestion de données avec une approche de modélisation de sujet dynamique sur les métadonnées associées disponibles. En conséquence, nous identifions les tendances de la recherche pour un domaine donné à des moments spécifiques et les tendances terminologiques référencées évoluent au fil des ans. Il a été possible de détecter la variation lexicale associée au fil du temps dans le contenu publié, déterminant finalement les soi-disant « sujets chauds » dans des instants arbitraires et aussi comment ils sont corrélés les uns aux autres.
      El modelado de temas comprende un conjunto de algoritmos de aprendizaje automático que permiten extraer temas de una colección de documentos. Estos algoritmos se han utilizado ampliamente en muchas áreas, como la identificación de temas dominantes en la investigación científica. Sin embargo, los trabajos que abordan tales problemas a menudo se centran en identificar temas estáticos, proporcionando instantáneas que no pueden mostrar cómo esos temas evolucionan con el tiempo. Con el objetivo de cerrar esta brecha, en este artículo, describimos un enfoque para el análisis y la clasificación dinámicos de conjuntos de artículos. Esto se logra consultando datos abiertos de bases de datos científicas notables a través de transferencias de estado representacional y, posteriormente, aplicando prácticas de gestión de datos con un enfoque dinámico de modelado de temas en los metadatos asociados disponibles. Como resultado, identificamos las tendencias de investigación para un campo determinado en instantes específicos y la evolución de las tendencias de la terminología referida a lo largo de los años. Fue posible detectar la variación léxica asociada a lo largo del tiempo en el contenido publicado, determinando en última instancia los llamados "temas candentes" en instantes arbitrarios y también cómo se correlacionan entre sí.
      Topic modeling comprises a set of machine learning algorithms that allow topics to be extracted from a collection of documents. These algorithms have been widely used in many areas, such as the identification of dominant topics in scientific research. However, works addressing such problems often focus on identifying static topics, providing snapshots that are unable to show how those topics evolve over time. Aiming to close this gap, in this article, we describe an approach for dynamic article set analysis and classification. This is accomplished by querying open data of notable scientific databases via representational state transfers and subsequently enforcing data management practices with a dynamic topic modeling approach on the associated metadata available. As a result, we identify research trends for a given field at specific instants and the referred terminology trends evolution throughout the years. It was possible to detect the associated lexical variation over time in published content, ultimately determining the so-called "hot topics" in arbitrary instants and also how they are correlated to each other.
      تشتمل نمذجة الموضوعات على مجموعة من خوارزميات التعلم الآلي التي تسمح باستخراج الموضوعات من مجموعة من المستندات. وقد استخدمت هذه الخوارزميات على نطاق واسع في العديد من المجالات، مثل تحديد الموضوعات السائدة في البحث العلمي. ومع ذلك، غالبًا ما تركز الأعمال التي تعالج مثل هذه المشكلات على تحديد الموضوعات الثابتة، وتوفير لقطات غير قادرة على إظهار كيفية تطور هذه الموضوعات بمرور الوقت. بهدف سد هذه الفجوة، في هذه المقالة، نصف نهجًا لتحليل وتصنيف مجموعة المقالات الديناميكية. يتم تحقيق ذلك من خلال الاستعلام عن البيانات المفتوحة لقواعد البيانات العلمية البارزة عبر عمليات نقل الحالة التمثيلية ثم فرض ممارسات إدارة البيانات باستخدام نهج نمذجة الموضوع الديناميكي على البيانات الوصفية المرتبطة المتاحة. ونتيجة لذلك، نحدد اتجاهات البحث لمجال معين في لحظات محددة وتطور اتجاهات المصطلحات المشار إليها على مر السنين. كان من الممكن اكتشاف الاختلاف المعجمي المرتبط بمرور الوقت في المحتوى المنشور، وتحديد ما يسمى "الموضوعات الساخنة" في اللحظات التعسفية وأيضًا كيفية ارتباطها ببعضها البعض.
    • ISSN:
      2169-3536
    • الرقم المعرف:
      10.1109/access.2023.3269660
    • الرقم المعرف:
      10.60692/qad8h-0c246
    • الرقم المعرف:
      10.60692/eevr3-h4j45
    • Rights:
      CC BY
    • الرقم المعرف:
      edsair.doi.dedup.....1e2a1a5d7049a9c55e96bffb1791a24c