[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

تشخیص نویسنده یک متن با استفاده از پردازش زبان طبیعی

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 184

فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

THCONF07_105

تاریخ نمایه سازی: 9 تیر 1403

چکیده مقاله:

در این مقاله، یک روش جدید به منظور شناسایی نویسنده متون فارسی با استفاده از تکنیک های یادگیری ماشین و پردازشزبان طبیعی ارائه شده است. در روش پیشنهادی از مجموعه خصوصیات آماری و محتوایی متون در کنار مشخصاتروانشناختی نویسندگان استفاده میشود. در گام اول روش پیشنهادی، مجموعه متون ورودی پیش پردازش شده و هر سندمتنی به مجموعه جملات تشکیل دهنده آن تجزیه میشود. پس از انجام عملیات پیش پردازش، نقش دستوری کلماتتشکیل دهنده هر جمله در متون ورودی شناسایی شده و براساس فراوانی برچسب های شناسایی شده، مجموعه ویژگی هایآماری متن استخراج میگردد. در گام بعدی روش پیشنهادی، کلمات کلیدی موجود در متن استخراج شده و بردار وزنی TF-IDF برای کلمات کلیدی استخراج شده از هر متن محاسبه خواهد شد. در گام بعدی، مجموعه ویژگی های آماری متن وبردار TF-IDF کلمات کلیدی متون با ویژگی های جمع آوری شده از طریق آزمون روانشناسی نویسندگان ادغام شده تامجموعه ویژگی های نهایی حاصل شود. در نهایت این ویژگی ها توسط یک مدل یادگیر مبتنی بر ترکیب شبکه عصبیمصنوعی و کدگذاری خروجی تصحیح کننده خطا مورد پردازش قرار گرفته تا نویسندگان مربوط به هر متن شناسایی شود. بهمنظور ارزیابی عملکرد روش پیشنهادی از یک پایگاه داده متشکل از ۱۵ نویسنده استفاده شده است. کارایی روش پیشنهادیدر تشخیص نویسندگان متون فارسی مورد ارزیابی قرار گرفته و نتایج حاصل با روشهای مشابه پیشین مقایسه شده است.نتایج حاصل نشان میدهد که روش پیشنهادی در تشخیص نویسندگان از دقت بالایی برخوردار بوده و میتواند در پردازشمتون فارسی بصورت کارآمدی عمل نماید.

نویسندگان

علی نوری

دانشجوی کارشناسی ارشد، گروه فناوری اطلاعات، موسسه آموزش عالی باختر، ایلام، ایران