کتابداران

این وبلاگ متعلق به دانشجویان کتابداری کارشناسی ارشد ورودی 89 دانشگاه تهران شمال می باشد.

جامعیت و مانعیت در ذخیره و بازیابی اطلاعات

به نام خدا

عنوان پروژه:جامعیت و مانعیت

درس: ذخیره و بازیابی اطلاعات

استاد: خانم دکتر مهر دخت وزیر پور

دانشجو:حمیده جعفری پاورسی

نیمسال اول سال تحصیلی

90-1389

 

مقدمه:

 در چند دهه اخیر بازیابی رایانه ای مورد توجه خاصی قرار گرفته که علت آن را می توان 4 عامل دانست: افزایش اهمیت زمان، تغییر در کمیت و کیفیت اطلاعات، تغییر در ماهیت نیازهای اطلاعاتی، تغییر در اهمیت منابع اطلاعاتی. این عوامل تغییر و توسعه در سیستم های بازیابی اطلاعات را به دنبال داشته و موجب مطرح شدن بحث هایی از جمله لزوم تغییر در ابزارهای اطلاعاتی، ایجاد سیستم های ارتباطی جدید و استفاده از آنها و تغییر معانی اشاعه اطلاعات شده اند.

بیان مفاهیم:

بازیابی اطلاعاتطبق  (ISO 2382/1 1984) اینگونه تعریف شده است:اعمال، شیوه­ها و رویه­هایی برای بازیابی اطلاعات ذخیره شده در جهت تهیه اطلاعات حول موضوعی معین. در عمل این تعریف ارائه شده از ایزو، شامل نمایه­سازی متن، تحلیل پرسش، و تحلیل ربط است؛ این استاندارد، متن، جداول، نمودارها، گفتار، تصویر و... را به عنوان داده مشخص می­کند.

از نگاه دایره­المعارف بریتانیکا، بازیابی اطلاعات، استحصال اطلاعات،بخصوص در یک پایگاه اطلاعاتی ذخیره شده در رایانه است. در این فرآیند،دو رویکرد اصلی عبارتند از انطباق واژگان در پرسش با نمایه موجود درپایگاه اطلاعاتی(جستجوی کلیدواژه­ای) و عبور کردن از پایگاه اطلاعاتی بابکارگیری پیوندهای فرارسانه­ای یا فرامتنی.

مقیاسهای جامعیت و مانعیت:

در این پروژه برای نظام بازیابی اطلاعات دو مقیاس به کار گرفته شده است: جامعیت و مانعیت. دلیل استفاده از این معیارها این است که کاربران به طور متوسط تمایل به بازیابی مقادیر زیادی از موضوعهای مربوط به هم دارند (که جامعیت بالایی را ایجاد می کند) این در حالی است که مایلند به طور همزمان بخش اعظمی از موضوعهای غیر مرتبط (که مانعیت بالایی را ایجاد میکند) حذف شود.

مفهوم میزان بازیابی اطلاعات یا جامعیت(Recall):

میزان جامعیت عبارتست از نسبت تعداد اسناد بازیابی شده مربوط به تعداد کل اسناد مربوط موجود در مجموعه. به عبارتی دیگر، جامعیت نسبت اسناد مربوطی که واقعاً بازیابی شده­اند، یا به عبارتی دیگر: جامعیت= نرخ موفقیت

مقدار جامعیت نسبی به این صورت تعریف می شود:

جامعیت نسبی یا بازیافت=   تعداد کل مدارک بازیابی شده مربوط
                                 کل مدارک مربوط در فایل

مفهوم میزان دقت بازیابی اطلاعات یا مانعیت(Precision):

مانعیت کسر خروجی یک جستجو است که برای یک عبارت جستجوی خاص، مرتبط است. به همین دلیل، محاسبه آن نیاز به دانستن نتایج مرتبط و نامرتبط در یک سری مدارک ارزیابی شده دارد.مانعیت به این صورت تعریف می شود:               مانعیت یا دقت=    تعداد مدارک بازیابی شده مربوط
                                               مجموع کل مدارک بازیابی شده از فایل

 رابطه بین جامعیت و مانعیت:

نمایش رابطه بین جامعیت و مانعیت با استفاده از یک ماتریس دو در دو امکان پذیر است. یک پیشینه ممکن است بازیابی شده و مرتبط، یا بازیابی شده و غیر مرتبط، بازیابی نشده و مرتبط یا بازیابی نشده و غیر مرتبط باشد.

کاربرد جامعیت و مانعیت:

جامعیت و مانعیت از زمان کرنفیلد در آزمونهای بسیاری به عنوان مقیاس به کار گرفته شده اند. به عنوان نمونه در ارزیابی لنکستر از پایگاه اطلاعاتی مدلارز در اواخر دهه 60 معلوم شد که بطور متوسط جامعیت کمتر از 60 درصد و مانعیت در حدود 50 درصد می باشد.
لنکستر و وارنر خاطر نشان می کنند که مانعیت در درجات پایین ممکن است در یک پایگاه اطلاعاتی کوچکتر قابل تحمل تر از یک پایگاه اطلاعاتی بزرگتر باشد.

کلارک و ویلت سه موتور کاوش وب را با استفاده از مقیاسهای جامعیت و مانعیت مقایسه کرده اند. آنها به هیچگونه تفاوت اساسی و مهم در جامعیت مابین موتورهای کاوش اکسایت، لایکوز و آلتاویستا دست نیافتند، ولی در آلتاویستا مانعیت مشخصا بر لایکوز برتری داشت. هر سه موتور امتیاز بیشتری در جامعیت در مقایسه با مانعیت کسب کرده اند. این امر به ویژه در لایکوز قابل توجه بود.

سنجش جامعیت و مانعیت:

سنجش مانعیت برای یک کاوش به سهولت انجام می گیرد اما اندازه گیری جامعیت به سادگی مقدور نیست. فقط یک راه برای تعیین دقیق جامعیت در یک کاوش وجود دارد و آن بررسی یکایک مدارک بازیابی نشده است و این امر به جز در مورد وضعیت های آزمایشی بسیار کوچک مقدور نیست .

مؤلفه­های مؤثر بر جامعیت و مانعیت در نظامهای بازیابی وب مدار:

مؤلفه اوّل: نحوه بیان درخواست: بیان درخواست دقیق یا درخواست نامعلوم و فازی بر جامعیت و مانعیت تأثیر می­گذارد.کلیدواژه­ها را بایستی با شکل صحیح و در قالبی مناسب وارد کرد و در انتظار پاسخ از سوی نظام بود.

برگمن نیاز به سه دانش ذهنی و فنی و معنایی را برای رسیدن به مقصود برای کاربر ضروری می­داند.

دانش ذهنی: دانش مورد نیاز برای تبدیل یک نیاز اطلاعاتی به یک درخواست قابل جستجو است.

دانش معنایی: چگونه و کی قابلیت­های موجود در نظام را باید بکار برد؟

 دانش فنی: مهارتهای اساسی بکارگیری رایانه و ترکیب درخواست­های وارد شده به­عنوان عبارت­های جستجوی خاص.

مؤلفه دوّم: فناوری­های موجود در نظام

مؤلفه سوّم: استنباط نظام و کاربر از مفهوم ربط

ارتباط ریزش کاذب با جامعیت و مانعیت:
هر چه میزان جامعیت بیش تر باشد، میزان ریزش کاذب نیز زیاد می شود و هر چه میزان مانعیت زیاد باشد، میزان ریزش کاذب کاهش می یابد.
بنابراین, فرمول زیر برای ریزش کاذب، جامعیت و مانعیت ارائه می شود:
ریزش کاذب
تعداد کل مدارک بازیابی شده= مانعیت

ریزش کاذب در بانک های اطلاعاتی:
ریزش کاذب در بانک های اطلاعاتی ممکن است به علل زیر اتفاق بیفتد:

1- اشتباه و خطا در بیان پرسش, که مهم ترین مرحله است؛ زیرا اگر در این مرحله اشتباه صورت پذیرد, در بقیه مراحل نیز دچار خطا خواهیم شد.               

2- اشتباه در تحلیل پرسش؛
3- اشتباه در انتخاب فایل و پایگاه اطلاعاتی مناسب؛
4- اشتباه در تدوین راهبرد کاوش؛
5- اشتباه در ساختار زبانی و ساختار کلمه ؛
6- استفاده از زبان کنترل شده؛
7- استفاده از کلید واژه کنترل نشده؛
8- کاوش کلمه ای در کلیه فیلدها، فیلد آزاد، یا متن آزاد ؛
9- نبودن اصطلاحنامه در پایگاه اطلاعاتی یا ضعیف بودن آن؛
10- بازیابی ناخواستة هم نویسه ها, بویژه در سرنام ها؛ مانند:
Aids و AIDS که اولی به معنی وسایل و ابزار کمکی است و دومی حروف آغازین کلمات Acquired Deficiency Syndrome Immune

برای جلوگیری از ریزش کاذب در بانک های اطلاعاتی، استفاده از شیوه های زیر توصیه می شود:
1- آشنایی کامل با بانک اطلاعاتی مورد نظر، شیوه های کاوش، پوشش موضوعی و امثال آن؛
2- استفاده از عملگر
AND برای اخص کردن مدارک بازیابی شده و افزایش مانعیت؛
3- استفاده از عملگر
NOT برای حذف رکوردهای ناخواسته؛
4- استفاده از زبان کنترل شده و اصطلاحنامه؛
5- کاوش کلمة مورد نظر در متن آزاد و بدون استفاده از زبان کنترل شده (در موارد استثنایی).

فهرست منابع:

 

 

1-     اشکنی پور، ناصر(1378). نقش Truncation  در جستجو و بازیابی اطلاعات. پیام کتابخانه، سال 9، شماره 34.

2-   پائو، میراندا لی (1379). مفاهیم بازیابی اطلاعات. ترجمه اسدا... آزاد و رحمت ا... فتاحی. مشهد: دانشگاه فردوسی مشهد، موسسه چاپ و انتشارات.

3-   چ‍ش‍م‍ه‌س‍ه‍راب‍ی‌، م‍ظف‍ر (1379). ت‍اث‍ی‍ر اس‍ت‍ف‍اده‌ از اص‍طلاح‍ن‍ام‍ه‌ درب‍ان‍ک‍ه‍ای‌ اطلاع‍ات‍ی‌ ک‍ت‍اب‍ش‍ن‍اخ‍ت‍ی‌ ب‍ر م‍ی‍زان‌ ج‍ام‍ع‍ی‍ت‌، م‍ان‍ع‍ی‍ت‌، و م‍دت‌زم‍ان‌ ج‍س‍ت‍ج‍وی‌ اطلاع‍ات‌ ب‍ازی‍اب‍ی‌ ش‍ده‌. ف‍ص‍ل‍ن‍ام‍ه‌ ک‍ت‍اب‌، شماره 42.

4-     خاصه، علی اکبر (مترجم). 1387. وب معنایی، معناشناسی، وارتباط علمی. دوره 10. شماره 1.

5-     خالویی، مرضیه (بهار 1386). مروری بر مدلهای بازیابی اطلاعات. فصلنامه علوم و فناوری اطلاعات. شماره 50.

6-   شاکری، صدیقه (1387). میزان جامعیت و مانعیت ابزارهای کاوش فارسی اینترنت در بازیابی اطلاعات در حوزه کتابداری و  اطلاع رسانی. فصلنامه کتاب، شماره 73.

7- شمس اژه ای، محسن. امیدی فر، سیروس. بررسی مؤلفه های مؤثربر میزان بازیابی اطلاعات (جامعیت) و دقت بازیابی اطلاعات (مانعیت) در نظام های بازیابی اطلاعات وب مدار. قابل دسترس در

http://www.nlai.ir/Default.aspx?tabid=1040

Visited on: November 2010

7-     شیری، علی اصغر؛ جامعیت و مانعیت. دایره المعارف کتابداری و اطلاع رسانی.

8-     کوشا، کیوان (1381). ابزارهای کاوش اینترنت: اصول، مهارتها وامکانات جستجو در وب؛ تهران: نشر کتابدار.

9-     Clarke, Sara J. (2000). "Search Engines for the World Wide

Web: An Evaluation of Recent Developments". New york:

.Howarth press

10- http://librarianarshad88.blogfa.com/post-5.aspx 

Visited on: November 2010

11- Keenan, Stella & Johnston, Colin (2000). Concise Dictionary  of  Library and Information Science and Colin. London: Bowker Saur.

 

 

 

 

+ گروه کتابداری ارشد ; ۳:٤٧ ‎ب.ظ ; ۱٤ آذر ۱۳۸٩
comment نظرات ()