معرفی الگوریتم خلاصه‌سازی معناگرای SIGS برای گراف‌های عظیم‌الجثه

نویسندگان

دانشگاه علم و صنعت

چکیده

امروزه گراف‌ها به‌طور گسترده در بسیاری از حوزه‌ها از جمله نرم‌افزار، شبکه، وب، شیمی، زیست، ژنتیک و حتی مخابرات و جامعه‌شناسی برای مدل‌سازی و پردازش داده‌ها استفاده می‌شوند. حجیم بودن و پیچیدگی زیاد گراف‌های داده، یکی از مهم‌ترین چالش‌ها در این زمینه است که کار استخراج اطلاعات و دانش مورد نیاز از میان مجموعه‌ای از داده‌ها را بسیار مشکل می‌سازد. در چنین شرایطی، استفاده از الگوریتم‌های خلاصه‌سازی گراف می‌تواند راه‌حل مناسبی باشد. در مقاله حاضر، الگوریتمی نو برای خلاصه‌سازی گراف‌ها ارائه شده که قادر است از یک گراف برحسب نیاز کاربران، خلاصه‌های مختلف با جزئیات متفاوت تولید کند. به‌علاوه، کاربر قادر است سطح خلاصه‌سازی را نیز کنترل کند. الگوریتم معرفی‌شده، با استفاده از پایگاه‌داده Neo4j که یکی از انواع پایگاه‌های داده‌ای غیررابطه‌ای است پیاده‌سازی شده است. همچنین آزمون‌هایی      به­وسیله داده‌های آزمایشگاهی و واقعی برای ارزیابی الگوریتم انجام گرفته است که نشان می‌دهد خلاصه‌های تولید‌شده، از کیفیت مناسبی برخوردار هستند. ضمن آنکه این الگوریتم از لحاظ مقیاس‌پذیری و کارایی از نمونه مشابه خود کیفیت بهتری ارائه می‌کند.

کلیدواژه‌ها