دسته بندی اسناد فارسی با استفاده از شبکه های عصبی
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,119
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
AEBSCONF03_007
تاریخ نمایه سازی: 19 اردیبهشت 1395
Abstract:
در این مقاله کار دسته بندی اسناد فارسی مشتقاز پیکره استاندارد روزنامه همشهری طی سالهای مختلف انجام گرفته به منظور اجرا استفاده از شبکه های عصبی با الگوریتم پس انتشار و شبکه های باور عمیق مبتنی بر یادگیری عمیق تحت زبان برنامه نویسی پایتون استفاده شده.اسناد پیکره همشهری به صورت فایل های مشخص XML استفاده شده اند.تگ های ID, DOC, TXT برای انجام کار پیش پردازش داده ها برای دسته بندی استخراج شدند.کار پیش پردازش داده ها شامل مراحل نشان گذاری،حذف علائم،حذف ایست واژه ها و ریشه یابی کلمات با استفاده از کتابخانه هضم انجام گرفته.پس از پیش پردازش با استفاده از بردار وزنی TF-IDFماتریس وزنی کلمات تشکیل شده و بعداز آن با استفاده از روش کاهش ابعادی SVD این ماتریس از زائدات کاهش یافته است.ماتریس کاهش یافته به عنوان ورودی برای شبکه های عصبی با الگوریتم پس انتشار استفاده شده و جهت دسته بندی با شبکه های باور عمیق کار پیش پردازش داده ها و سایر مراحل با استفاده از کتابخانه های زبان پایتون که به این منظور در مبحث یادگیری عمیق طراحی شده اند انجام گرفته است.عمل یادگیری در شبکه های عصبی و شبکه باور عمیق در 100 رده انجام پذیرفته و معیارهای قابل بررسی در این مسئله دقت، فراخوانی، اندازه گیریF-و کارایی می باشند.پس از اجرای کار دسته بندی بر روی این دو دسته بند نتایج به دست آمده نشان داده است که دقت ، سرعت و کارایی در شبکه های باور عمیق به مراتب مطلوب تر از شبکه های عصبی با الگوریتم پس انتشار است.
Keywords:
Authors
زهرا نوریان
نویسنده مسوول: دانشجوی فوق لیسانس دانشگاه آزاد اسلامی واحددامغان
میثم یدالله زاده طبری
مربی فوق لیسانس دانشگاه آزاد بابل ، دکتری هوش مصنوعی دانشگاه شاهرود
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :