پایگاه داده های زبان فارسی

پایگاه داده های زبان فارسی (http://pldb.ihcs.ac.ir) به منظور ایجاد مجموعه ای بزرگ از پیکره های گوناگون زبان فارسی امروز طراحی شده است و در آن متن های برگزیده ادبی، علمی، هنری، سیاسی و مانند اینها از گونه های نوشتاری و گفتاری فارسی وجود دارد. این سامانه امکان جستجوی واژه ها، ترکیب ها ، باهمایی ها و بررسی بسامد آنها را به همراه گزارش های آماری متنوعی از متون فراهم می کند. افزون بر اصل متن ها و واژه های به کاررفته در آنها، معنی، مقوله دستوری، آوانگاشت و ریشه یا (بنواژه) بسیاری از واژه ها نیز در پایگاه وجود دارد.

ورود به پایگاه

کاربران قبل از معرفی شدن به سیستم می توانند از امکاناتی که به صورت پیش فرض برای آنان در نظر گرفته شده است استفاده کنند که شامل مشاهده و گزارشگیری از چند اثر انتخاب شده ازسوی مدیر وبگاه می باشد. چنانچه کاربر بخواهد متن های بیشتری را مشاهده کند باید در قسمت معرفی کاربر، خود را به سیستم معرفی کند . در معرفی کاربر 3 فیلد اطلاعاتی نام کاربری ، گذرواژه و نام از موارد الزامی هستند.  پس از آن کاربر باید منتظر شود تا مدیر وبگاه دسترسی های او را اصلاح کند. بعد از تایید مدیر وبگاه کاربر می تواند با ورود به پایگاه متون بیشتری را مشاهده کند و گزارش های خود را تهیه کند.

دسترسی به پایگاه متون

 در گزینگان (منوی) دسترسی به پایگاه متون گزارشات سیستم قرار دارند. برای دسترسی به آنها کاربر پس از ورود به پایگاه  گزارش مورد نظر خود را انتخاب می کند. گزارشات ارائه شده بر حسب آخرین متون تایید شده در پایگاه ارائه می گردد.

فهرست بسامدی واژه ها: در این گزارش واژه های موجود و بسامد (تعداد تکرار) آنها فهرست می شود. کاربر می تواند از فهرست عناوین اثر کتابهای مورد نظر خود را انتخاب نموده و یا با انتخاب تمامی موارد ، تمامی کتابهایی که حق دسترسی به آنها را دارد در گزارشی مشاهده کند. گزینه هایی که می تواند گزارش را محدودتر کند نام نویسنده، تاریخ، رشته، گونه زبانی،وضعیت اثر و محدوده یک واژه تا واژه دیگر است. فهرست واژه ها به ترتیب بسامد نزولی یا صعودی ، الفبایی یا الفبایی وارونه مرتب می شود.

فهرست  واژه نما: در این گزارش واژه ها به همراه بسامد (تعداد تکرار)، معنی، آوا، شماره سطری که واژه در آن قرار گرفته، صفحه ای که واژه در آن است، نام نویسنده اثر،نام اثر و جمله شاهد آن (جمله ای که واژه در آن قرار دارد)  فهرست می شود شود. کاربر می تواند از فهرست عناوین اثر کتابهای مورد نظر خود را برگزیند و یا با گزینه تمامی موارد ، تمامی کتابهایی را که مجاز به دسترسی است در گزارش مشاهده کند. گزینه هایی که می تواند گزارش را محدودتر کند نام نویسنده، تاریخ، رشته، گونه زبانی،وضعیت، معنی، آوا و از واژه تا واژه می باشد.این فهرست  به ترتیب  الفبایی یا الفبایی وارونه مرتب شده است.

واژه های دارای برچسب دستوری: در این گزارش واژه های موجود، بسامد (تعداد تکرار) و برچسب دستوری آنها غهرست می شود. کاربر می تواند از فهرست عناوین اثر ، کتابهای مورد نظر خود را برگزیند و یا با گزینه تمامی موارد ، تمامی کتابهایی که حق دسترسی به آنها را دارد در گزارش مشاهده کند. گزینه هایی که می تواند گزارش را محدودتر کند نام نویسنده، تاریخ، رشته، گونه زبانی،وضعیت و از واژه تا واژه است. فهرست واژه ها و بسامد آنها به ترتیب  الفبایی یا الفبایی وارونه مرتب شده اند.

فهرست آماری واژگان: در این گزارش بر اساس شرایط تنظیم شده، آمار واژه هایی را که در پایگاه ذخیره شده است ارائه می شود. آمار مذکور شامل بسامد ، بسامد نسبی در پیکره، تعداد واژه نماینده با بسامد، تعداد کل واژه های بکار رفته با بسامد، جمع واژه های نماینده، جمع واژه های بکاررفته، درصد واژه های نماینده و درصد واژه های به کار رفته می باشد.

گشت و گذار در متون

نمایش عادی متن : در این بخش از پایگاه، کاربر با گزینش اثر و یا اثر فرعی (زیر اثر) می تواند صفحات کتاب مورد نظر خود را مشاهده کند. در انتهای صفحه کلیدهایی برای رفتن به صفحات بعدی، قبلی، آخرین صفحه و اولین صفحه وجود دارد. جهت رفتن به صفحه ای خاص در فیلد در نظر گرفته شده شماره صفحه مورد نظر را وارد کرده و کلید "شروع" را فشار دهید. چنانچه به دنبال  واژه خاصی می گردید، واژه جستجو را وارد کرده و اگر دقیقا همان کلمه مورد نظر است ، "تطبیق کامل" را انتخاب نمایید و اگر واژه هایی را که بخشی از آن شامل واژه جستجوی وارد شده است را می خواهید، "تطبیق کامل" را از حالت انتخاب شده خارج نموده و کلید شروع را بزنید. پس از آن واژه های یافت شده با رنگ زرد مشخص می شوند.

نمایش برچسبها: در این قسمت، کاربر با انتخاب اثر و زیر اثر مربوطه می تواند صفحات کتاب مورد نظر خود را مشاهده کند. در انتهای صفحه کلیدهایی برای رفتن به صفحات بعدی، قبلی، آخرین صفحه و اولین صفحه وجود دارد. جهت رفتن به صفحه ای خاص در فیلد در نظر گرفته شده شماره صفحه مورد نظر را وارد کرده و کلید "شروع" را فشار دهید. در قسمت پایین صفحه آیتم های انتخابی رنگی را مشاهده می کنید که حالت پیش فرض آنها "متن عادی" به رنگ مشکی می باشد( به این معنی که در حال حاضر فقط متن را مشاهده می کنید) . در حالت انتخاب "دستوری"  نقش دستوری واژه در کنار آن واژه و با رنگ سبز نوشته می شود. چنانچه گزینه "آوایی"  انتخاب شود، در کنار واژه آوای آن با رنگ آبی قرار می گیرد. در صورت انتخاب "معنایی" می توان معنای هر واژه را درکنار همان واژه و با رنگ بنفش مشاهده کرد. با انتخاب گزینه "ریشه" در کنار هر واژه ریشه آن با رنگ قرمز قرار می گیرد و انتخاب گزینه "تمام برچسبها" تمامی موارد ذکر شده را با رنگهای مشخص شده به دنبال واژه قرار می دهد.

برای جستجوی یک  واژه، آنرا در خانه جستجو وارد کنید. اگر جستجو برای واژه ساده است باید ، "تطبیق کامل" انتخاب شود و اگر واژه بخشی از یک ترکیب یا عبارت است ،  نشانه "تیک" را از جلوی  "تطبیق کامل" بردارید و کلید شروع را بزنید. پس از آن واژه های یافت شده با رنگ زرد مشخص می شوند. برای جستجوی ترکیبی می توان دو واژه همایند را حتی بافاصله هایی در متن یافت. به این ترتیب که اگر دو واژه را در "عبارت جستجو" جداازهم وارد کنیم، این مجموعه تا فاصله سه واژه جستجو شده و با رنگ زرد مشخص می شود.


نظرات (۰)

هیچ نظری هنوز ثبت نشده است

فرم ارسال نظر

ارسال نظر آزاد است، اما اگر قبلا در بیان ثبت نام کرده اید می توانید ابتدا وارد شوید.
شما میتوانید از این تگهای html استفاده کنید:
<b> یا <strong>، <em> یا <i>، <u>، <strike> یا <s>، <sup>، <sub>، <blockquote>، <code>، <pre>، <hr>، <br>، <p>، <a href="" title="">، <span style="">، <div align="">
تجدید کد امنیتی