کتابداران

این وبلاگ متعلق به دانشجویان کتابداری کارشناسی ارشد ورودی 89 دانشگاه تهران شمال می باشد.

مدلهای کلاسیک بازیابی اطلاعات

 

مدلهای کلاسیک بازیابی اطلاعات

مربوط به درس ذخیره و بازیابی اطلاعات

استاد مربوطه: سرکارخانم دکتر وزیرپور کشمیری

ارائه دهنده: زهرا علی اکبری مجید

زمستان 1389


تاریخچه :

تاریخچه ایجاد و گسترش نظام‌های بازیابی اطلاعات را می‌توان به چندین دوره نسبتاً روشن تقسیم کرد. قبل از سال‌های ۱۹۴۰ تهیه می‌شد، نظام‌های بازیابی اطلاعات تنها از نوع دستی محض بود، یعنی نمایه‌ها و فهرست‌ها به شکل چاپی و کارتی تهیه می‌شد. این وسایل بازیابی، پیش‌همارا و غیرقابل دستکاری است و متکی بر سازماندهی خطی (تک بعدی) بوده و قابلیت‌های بسیار محدودی برای جست‌وجو و بازیابی دارند. در سال‌های ۱۹۴۰، مهم‌ترین پیشرفت در تاریخچه بازیابی اطلاعات یعنی ابداع نظام‌های بازیابی که پس‌همارا و قابل دستکاری هستند روی داد.  

Ø  این نظام‌ها که هنوز عمدتاً دستی بودند توسط باتن و کوردونیر (پیکابو، یا تطابق نوری)، موئرز (برگه‌های منگنه‌ای)، و نیز توسط مورتیمر تاب[۳] (نظام تک واژه‌ای) عرضه شد. این نظام‌های پس‌همارای اولیه مزایای قابل توجهی نسبت به پیشینیان خود عرضه کردند. آنها نیای مسلّم نظام‌های رایانه‌ای نوین به حساب می‌آیند. در سال‌های ۱۹۵۰ اشکال اولیه خودکارسازی نمایه‌سازی پس‌همارا توسط نظام‌های داده‌پردازی برگه منگنه پدید آمد. نظام‌های برگه منگنه در دهه ۱۹۵۰، در واقع، اسلاف بلافصل نظام‌های رایانه‌ای سال‌های ۱۹۶۰ بودند. سال‌های ۱۹۶۰ دوران بازیابی رایانه‌ای به شیوه گسسته، پردازش دسته‌ای و نواری را تشکیل می‌داد. در سال‌های ۱۹۷۰، با توسعه سخت‌افزارها و نرم‌افزارهای رایانه‌ای، امکان انجام جست‌وجوهای پیوسته یا تعاملی فراهم آمد.

Ø  نظام‌های پیوسته بازیابی، علاوه بر افزایش سرعت، امکان دریافت بازخورد جست‌وجو در روند جست‌وجو و، در صورت لزوم، تغییر و اصلاح آن را به استفاده کننده می‌دادند. مهم‌ترین مزیت بازیابی پیوسته امکان دسترسی از راه دور بود. در این مورد شرکت‌های بزرگی چون دیالوگ و بی.آر.اس. در بخش خصوصی و کتابخانه ملی پزشکی در بخش دولتی، با عرضه نظام بازیابی مدلاین، فعالیت‌های فراوانی داشته‌اند. از ابتدای سال‌های ۱۹۸۰، توسعه و گسترش ذخیره و بازیابی اطلاعات به شکل متن کامل از جمله تحولات و رویدادهای مهمی است که شکل گرفته است. هر چند اندیشه‌ها و تلاش‌های مربوط به این شکل از ذخیره و بازیابی به سال‌های ،۱۹۷۰ زمان اولین تلاش‌ها برای واردکردن متون حقوقی در رایانه و جست‌وجوی آزاد بر روی آن متون، باز می‌گردد با ازدیاد رایانه‌های شخصی و پیدایش رسانه‌های ذخیره‌سازی نوری مانند دیسک فشرده و نیز رواج نشر رومیزی (دی.تی.پی.) بود که ایجاد پایگاه‌های تمام متن و نیز فنون بازیابی از متن عمومیت بیشتری یافت و در دسترس استفاده‌کنندگان قرار گرفت.

Ø  بازیابی در این نوع نظام‌ها که عمدتاً مبتنی بر استفاده از زبان طبیعی است و از این لحاظ در مقابل نظام‌های مبتنی بر واژگان مهار شده قرار می‌گیرند دارای جذابیت‌های زیادی برای استفاده‌کنندگان از آنهاست، لکن برای بازدهی بیشتر از مزایای هر دو نظام به طور همزمان استفاده می‌شود. در سال‌های اخیر، استفاده از فنون بصری جایگاه خاصی یافته و چالش‌های جدید و بحث‌های گسترده‌ای را به دنبال داشته است. استفاده از این فنون، به ویژه برای طراحی واسط‌های کاربر، باعث سهولت بیشتر در استفاده از نظام‌های بازیابی و فراگیرتر شدن دامنه استفاده از این نظام‌ها گردیده است.

Ø  بازیابی اطلاعات ممکن است به دلایل زیر باشد:

Ø  ۱) حجم زیاد اطلاعاتی که می‌بایست دسترس‌پذیر گردد؛

Ø  ۲) مشکلات فراهم آوردن ذخایر عظیم مواد و منابع به صورتی که بتوان به راحتی به آنها دست یافت؛

Ø  ۳) افزایش مشکلات فنی ناشی از اشاعه گزینشی حجم زیاد منابع برای استفاده‌کنندگان ناهمگن.

Ø  در روند ذخیره و بازیابی اطلاعات دو مرحله متمایز تحلیل اطلاعات و جست‌وجوی اطلاعات را می‌توان مشخص ساخت.

Ø  ذخیره و بازیابی اطلاعات
فعالیت هایی که برای تحلیل و سازماندهی مدارک و منابع صورت می گیرد ذخیره اطلاعات، و تلاش هایی که برای یافتن یک یا چند مدرک از میان انبوه مدارک ذخیره شده انجام می شود بازیابی اطلاعات نام دارد. نظام هایی که این جریان ها در آنها روی می دهد نظام های ذخیره و بازیابی اطلاعات خوانده می شود (۶۶۱:۵). نظام های ذخیره و بازیابی اطلاعات معمولاً به منظور دسترس پذیر کردن مجموعه ای از منابع اطلاعاتی برای استفاده کننده ای که مایل به کسب این اطلاعات است طراحی می گردد.

Ø  اطلاعاتی که در نظام های ذخیره و بازیابی اطلاعات ذخیره می شود یا صرفاً شامل داده های کتابشناختی است، مانند مشخصات کتاب ها، اسناد و مدارک، و مقاله های مجلات؛ یا اصل مدرک است که همراه مشخصات آن عرضه می شود. حالت اخیر پایگاه داده های تمام متن نام دارد. نظام های بازیابی اطلاعات را در معنای وسیع می توان برای دستیابی به مجموعه های تصویری، فیلم، پروانه های ثبت اختراع، و جز آن نیز مورد استفاده قرار داد. در هر حال، هدف هر نظام ذخیره و بازیابی اطلاعات آن است که در اسرع وقت بیشترین اطلاعات مرتبط با نیاز استفاده کننده را ـ آن طور که در درخواست وی ذکر شده ـ در اختیار بگذارد.

● سازماندهی فایل ها
در نظام های رایانه ای ذخیره و بازیابی اطلاعات، داده ها معمولاً در قالب رکورد ذخیره می شوند و مجموعه ای از رکوردها یک فایل را تشکیل می دهند. شیوه ذخیره رکوردها در داخل فایل و شیوه ارتباط آنها با یکدیگر مطلبی است که تحت عنوان ساختار فایل یا سازماندهی فایل مورد بحث قرار می گیرد. برای سازماندهی فایل به طور معمول چندین روش وجود دارد که ساده ترین آنها فایل ترتیبی است.

Ø  در این نوع فایل هیچ گونه راهنما یا اشاره گر ربط دهنده ای ایجاد نمی شود و معمولاً رکوردها بدون نظم خاصی در کنار یکدیگر قرار می گیرند. یافتن رکوردهای خاص در این گونه فایل ها منوط به آن است که یکایک رکوردها از ابتدای فایل بررسی شود. چنانچه با حجم زیادی از اطلاعات روبه رو باشیم استفاده از این نوع فایل بسیار وقت گیر است. در عوض، این ساختار حداقل فضای ذخیره سازی را به خود اختصاص می دهد و اجرای آن نیز نسبتاً آسان است.

نوع دیگر، فایل شاخص دار یا فایل مقلوب است. در این نوع ساختار، که در نظام های معروف ذخیره و بازیابی اطلاعات به وفور مورد استفاده قرار گرفته، به ازای فیلدهای شاخص یا فیلدهایی که در نظر است بر روی آنها جست وجو صورت گیرد، فایل یا فایل های جداگانه ای به نام فایل شاخص یا فایل مقلوب ایجاد می شود. محتوای این فایل را مقادیر فیلد شاخص و نشانی متناظر به آن در فایل اصلی تشکیل می دهد. هنگام بازیابی،ابتدا عبارت مورد نظر در فایل مقلوب جست وجو می شود و سپس براساس شماره مدرک یا نشانی که در مقابل آن عبارت وجود دارد، رکورد کامل از فایل اصلی بازیابی می گردد. در این ساختار، به جهت آنکه حداقل دو فایل ایجاد می شود فضای بیشتری اشغال می گردد، ولی در مقابل، سرعت جست وجو و بازیابی به خصوص در پایگاه های حجیم تا حد زیادی بالا می رود. سومین نوع را فایل با دستیابی مستقیم می نامند. در این ساختار، امکان نوشتن یا خواندن رکورد بدون در نظر گرفتن محل آن وجود دارددر این فایل ها لازم است که فیلدی به عنوان فیلد کلید مشخص گردد. در این نوع ساختار برای یافتن محل آزاد در حافظه جهت درج رکورد یا پیدا کردن رکوردی خاص، از فن آدرس دهیِ درهم استفاده می شود. مهم ترین ویژگی و مزیّت این ساختار، صرفه جویی در فضای حافظه و نیز سرعت زیاد در دستیابی به رکوردهاست. متقابلاً نقطه ضعف آن در سختی پیاده سازی و اجرای آن است.

Ø  ساختار دیگر، ساختار زنجیره ای است و ویژگی آن در این است که همه اقلامی که نشان دهنده شناساگر فرضی مشترکی هستند با رابط ها یا اشاره گرهایی مناسب، به هم زنجیر می شوند. طبیعتاً یک راهنما دسترسی به اولین فقره را در هر زنجیره فراهم می آورد و فایل را می توان با تعقیب اشاره گرهای درونی هر زنجیره جست وجو کرد. فایل های زنجیره ای نسبت به فایل های ترتیبی سرعت بیشتری را فراهم می آورند، اما به فضای ذخیره سازی قابل توجهی برای ذخیره اشاره گرها و راهنماها نیاز دارند

جست وجوی اطلاعات
در این مرحله، وظیفه نظام ذخیره و بازیابی، بررسی و شناخت درخواست استفاده کننده، پویش یا جست وجو در بانک اطلاعاتی، و یافتن و نمایش رکوردهایی است که با درخواست ارائه شده انطباق دارد. دستیابی به این هدف، یعنی یافتن اطلاعاتی که نیاز استفاده کننده را به طور قطع برطرف کند عملاً کار آسانی نیست، زیرا از یک سو استفاده کننده به طور دقیق نیاز اطلاعاتی خود را نمی داند و در برخی اوقات نیز علی رغم آگاهی به نیاز اطلاعاتی خود، ممکن است نتواند آن را با عبارت های مناسب بیان کند.

Ø  از سوی دیگر، ممکن است اصطلاحات یا عباراتی که به عنوان موضوع مدارک در نظر گرفته شده چندان دقیق نباشند و نتوانند تصویر کاملی از محتوای مدرک بدست دهند. بدین سبب گفته می شود که وجه خروجی نظام بازیابی اطلاعات (پاسخگویی به درخواست استفاده کننده) همواره پیچیده تر از وجه ورودی آن است و بدین لحاظ باید بخش خروجی مورد توجه بیشتری قرار گیرد

Ø  عناصر اصلی یک مدل بازیابی اطلاعات

Ø  بازیابی اطلاعات توسط کاربر

Ø  مدلهای کلاسیک بازیابی اطلاعات

Ø  مدل بولی

Ø  مدل احتمالی

Ø  مدل فرامتن

مدل فضای بُرداری

Ø  عناصر اصلی یک مدل بازیابی اطلاعات توسط کاربر

Ø  1- مجموعه ای از اسناد  Documents   

Ø  2- پرسشها  Queries                     

Ø  3- چارچوبی برای ارائه اسناد، پرسشها و ارتباط بین آنها   Framework                                            

Ø  4- تابع رتبه بندی کردن اسناد برحسب میزان ربط با پرسش

مدلهای کلاسیک بازیابی اطلاعات

Ø  مبتنی بر واژه های نمایه ایی هستند. Index term-base

l  استفاده از یک واژگان کنترل شده

l  استفاده از تمام واژه های به کاررفته در متن به جز stop lists

Ø  مبتنی بر سنجش عددی واژه های نمایه ایی هستند. Numerical weights

l  سنجش عددی هر واژه مستقل از واژه دیگری است.

l  سنجش عددی نشان دهنده اهمیت آن واژه در مدرک است. (سنجش عددی بیشتر= اهمیت بالاتر)

بولی Boolean model

Ø  برای فایلهایی کاربرد دارد که به صورت مقلوب ذخیره شده باشند؛

Ø  سادگی  از مهمترین ویژگیهای آن است؛

Ø  راحت برای استفاده اما مشکل برای تطابق با نیاز اطلاعاتی کاربر؛

Ø  تطابق با اکثر سیستمهای تجاری کتابشناختی اولیه؛

Ø  مبتنی بر نظریه مجموعه هاست و از عملگرهای  and, or, not استفاده می کند؛

مدلهای کلاسیک بازیابی اطلاعات>مدل بولی>سنجش عددی واژه ها

Ø  در مدل بولی وزن واژه ها یا صفر است و یا یک.

در صورت وجود واژه در مدرک یک و در صورت عدم وجود وزن آن واژه صفر است.

مدل بولی> معایب

Ø  یک منطق دو مقداری است. Binary decision criterion

Ø  قادر به نشان دادن میزان ربط میان مدارک نیست؛

Ø  عدم رتبه بندی نتایج بر اساس میزان مشابهت آنها با جستجو؛

Ø  واژه ها فقط در مدارک سنجیده می شوند؛

Ø  عبارت های بولی به صورت کلیدواژه های صریح و دقیق بیان می شوند و به آسانی قابل انطباق با نیاز اطلاعاتی کاربر نمی باشد.

 برای برطرف کردن این عیوب مقیاس سنجش عددی واژه ها را تغییر دادند و مدلهایی با قابلیت افزونتر ایجاد شد نظیر مدل احتمالی ......


مدلهای کلاسیک بازیابی اطلاعات>مدل احتمالی probabilistic model 

مدلی مبتنی بر نظریه احتمالات است که میزان مشابهت (میزان ارتباط ) مدارک با پرسشها به صورت احتمالی حدس زده می شود. در این مدل مرز میان مدارک مرتبط و نا مرتبط بستگی به احتمال بحرانی دارد.

Ø  در مدل احتمالی احتمال اینکه کاربر مدرک را مرتبط با جستجوی خود بیابد، تخمین زده می شود.

مزیت اصلی این مدل مرتب شدن نتایج بر اساس میزان ربط آنها، از زیاد به کم است.



مدلهای کلاسیک بازیابی اطلاعات>مدل احتمالی> سنجش عددی مدارک

Ø  در این مدل در ابتدا نتایج با استفاده از منطق دو مقداری بازیابی شده سپس میزان مشابهت و یا ارتباط مدارک (دو به دو) محاسبه می شود.

Ø  میزان ارتباط n مدرک در مجموعه با استفاده از ماتریس n*n نشان داده می شود که مقدار عددی در هر خانه نشان دهنده درجه ارتباط موضوعی میان دو مدرک است.

مدلهای کلاسیک بازیابی اطلاعات>مدل احتمالی<یک مثال

از یک پایگاه اطلاعاتی از جستجوی ”عنوان شامل اساتید باشد “ دو مدرک زیر بازیابی شده است. بر اساس مدل احتمالی دو مدرک به صورت زیر رتبه بندی می شوند.

1- اساتید و مشکلات آنها

2- بررسی شخصیت افراد از نظر روانی در فصل امتحانات: شامل اساتید، کارکنان، و دانشجویان در دانشگاه ها

مدرک اول با احتمال 50% با مدرک دوم در ارتباط است ولی مدرک دوم با احتمال 12% با مدرک اول در ارتباط است.

مدلهای کلاسیک بازیابی اطلاعات>مدل احتمالی>معایب

Ø  دو مقداری است؛ Binary decision criterion

Ø  سنجش مدارک در این مدل مستقل اند ؛

Ø  نیاز به محاسبات گسترده بویژه در مجموعه های بزرگ ؛

Ø  مدت زمان لازم برای انجام جستجو افزایش می یاید و در نتیجه سرعت بازیابی کاهش می یاید ؛

Ø  اندازه ماتریس برای مجموعه های بزرگ مشکل زاست ؛

Ø  عدم رتبه بندی کردن نتایج بر اساس میزان ارتباط با جستجو ؛

Ø  در نظر نگرفتن فراوانی (بسامد) واژه ها در یک مدرک.

مدلهای کلاسیک بازیابی اطلاعات> فرامتن

Ø  شکل دیگری که برای جست‌وجو و بازیابی اطلاعات ارائه شده، و به خصوص در سال‌های اخیر با رشد شبکه وب گسترش یافته است، بازیابی فرامتنی است. روش‌هایی که تاکنون ذکر شد عمدتاً بر این محور استوار است که کاربر پرسش خود را در قالب واژه‌ها و عباراتی به نظام ارائه کند تا نظام، پس از جست‌وجو، تعدادی مدرک را به عنوان نتیجه جست‌وجو بازگرداند.

مدلهای کلاسیک بازیابی فرامتن

در مقابل این نظام‌ها که می‌توان آنها را نظام‌های پرسش مدار نامید، نظام‌های فرامتن تلاش می‌کنند با ایجاد پیوندهای مفهومی میان مدارک و فراهم‌آوردن امکان مرور و راهبری، کاربر را در رسیدن به مدرک مورد نظر یاری دهند. از این دو نوع رویکرد، به ترتیب، به حرکت از کجا به چه (کاربر می‌داند در کجای بانک اطلاعاتی است و می‌خواهد بداند در آنجا چه چیز وجود دارد) و حرکت از چه به کجا (کاربر می‌داند چه چیزی می‌خواهد و می‌خواهد بداند آن چیز را در کجا می‌تواند بیابد) تعبیر شده است (۳۰۰:۴).

 

Ø  مدل فضای بُرداری

Ø  در حالی که برخی تلاش کردند تا با انجام اصلاحاتی در مدل بولی بر نقاط ضعف آن غلبه کنند، دیگران با راهبرد متفاوتی به نام مدل فضای برداری به بازیابی اطلاعات پرداختند. در این مدل، مدارک و پرس‌وجوها به صورت بردارهایی در فضایی سه بعدی در نظر گرفته می‌شود که هر بعد با مدخلی در نمایه مقلوب متناظر است. مثلاً مدرک D و پرس و جوی Q در شکل برداری به صورت D= (d۱, d۲, d۳, .... dn)و Q= (q۱, q۲, q۳, .... qn) بیان می‌شود که n مجموع اصطلاحات نمایه‌ای و هر کدام از مقادیر داخل پرانتز وزن هر اصطلاح بوده که بیانگر اهمیت اصطلاح است. شناخته شده‌ترین وزن اصطلاحی، بسامد مقلوب مدرک نامیده می‌شود که با بسامد مجموعه (تعداد مدارک مجموعه‌ای که در آن یک اصطلاح خاص وجود دارد) تغییر می‌کند.

Ø  بسامد مقلوب مدرک نوعاً از طریقdkN Log محاسبه می‌شود که در آن N تعداد مدارک مجموعه و dk تعداد مدارکی است که اصطلاح k در آن ظاهر می‌شود. فرمول‌های مختلفی برای محاسبه اوزان اصطلاح وجود دارد که برخی از آنها گونه‌هایی از وزن IDFبوده و از بسامد مدرک (تعداد دفعاتی که اصطلاحی در مدرکی ظاهر می‌شود) و عادی‌سازی بهره می‌گیرند. مثلاً می‌توان IDF را در بسامد مدرک ضرب کرد (تا اصطلاحاتی که مکرراً در مدرکی ظاهر می‌شوند اهمیت بیشتری پیدا کنند) و بر عامل عادی‌سازی طول بردارها تقسیم کرد تا طول متغیر بردارهای مدرک مجموعه تنظیم شود. این عمل تابع فرمول زیر است:

Ø  Wki = idfk×tfk i Svector i (tfi×idf)۲

Ø  که در آن Wki وزن اصطلاح K موجود در مدرک d، tfki بسامد اصطلاح k در مدرک d، idfk بسامد مقلوب مدرک، و مخرج کسر عامل عادی‌سازی، و idfk بسامد مقلوب مدرک است.

Ø  مدل‌برداری، سیاهه‌ای ترتیبی از مدارک براساس مشابهت آنها با پرسش، با در نظر گرفتن زاویه میان بردار مدرک و بردار پرسش، به عنوان مقیاس مشابهت ارائه می‌دهد. علاوه بر فرمول‌های توزین اصطلاح، فرمول‌های دیگری نیز برای محاسبه مشابهت "پرسش ـ مدرک" پیشنهاد شده است. آزمایش‌ها نشان داده است که انتخاب مقیاس جدید مشابهت می‌تواند بر عملکرد بازیابی تأثیر قابل ملاحظه‌ای داشته باشد. یکی از مقیاس‌های مشابهت که به طور گسترده مورد استفاده قرار گرفته مشابهت کسینوسی است که حاصل ضرب درونی میان عناصر عادی سازی شده بردار در طول بردارهاست.

Ø  گونه دیگری از مدل‌برداری مدل خوشه‌ای است که در آن با محاسبه مشابهت برداری مدرک به مدرک و با استفاده از معیارهای خوشه‌بندی گروهی از مدارک شکل می‌گیرد. معیارهای خوشه‌بندی مشخص می‌کند چه چیز خوشه‌ای از مدارک را تشکیل می‌دهد. برخلاف مدل فضای برداری که در آن بردار هر پرسش با بردار هر مدرک مقایسه می‌شود، در اینجا، بردار هر پرسش با بردار مرکز خوشه، یعنی برداری که خوشه را به صورت کلی ارائه می‌کند، مقایسه می‌گردد. مزیت رویکرد خوشه‌ای زمانی جلوه‌گر می‌شود که با مجموعه مدارکی به کار رود که بتواند خوشه‌های فشرده تشکیل دهد. همچنین، این مدل در محیطی مؤثر شناخته می‌شود که خوشه‌ها تمایل به ارائه مشترک مدارک مرتبط داشته باشند.

Ø  ) پوشش مجموعه، یا تعداد مدرک مرتبطی که در هر مجموعه وجود دارد؛

Ø  ۲) زمان پاسخگویی، یعنی فاصله متوسط میان زمان درخواست جست‌وجو و به‌دست‌آوردن پاسخ؛

Ø  ۳) شکل خروجی، یعنی شکل مدارک بازیابی شده، شماره مدرک، مآخذ کتابشناختی، مآخذ همراه با چکیده‌ها، متن کامل، و جز آن؛

Ø  ۴) تلاش استفاده کننده، یعنی کوششی که استفاده‌کننده در مرحله خروجی (جدا کردن مدارک مرتبط از نامرتبط)، در مرحله درخواست (بیان هر چه دقیق‌تر پرسش یا نیاز اطلاعاتی)، و در مرحله تدوین راهبرد جست‌وجو (بررسی راهبرد تدوین شده و اصلاح آن) انجام می‌دهد؛

Ø  ۵) جامعیت، یعنی توانایی نظام در بازیابی متون مرتبط؛ و

Ø  ۶) مانعیت، یعنی توانایی نظام در بازیابی نکردن متون نامرتبط.

Ø  گفته می‌شود که موارد ۱ تا ۴ به راحتی قابل ارزیابی است لیکن این جامعیت و مانعیت است که در کنار یکدیگر سودمندی نظام را نشان می‌دهند. در واقع این دو معیار در کنار هم توانایی فیلتری نظام را بیان می‌کنند و استفاده از هر کدام از آنها به تنهایی چندان کارساز نیست (۵۵:۳-۶۱؛ ۲۰۴:۶). در هر نظام بازیابی، مطلوب آن است که نسبت جامعیت و مانعیت هر دو ۱۰۰ درصد باشند، یعنی نظام بتواند کلیه مدارک مرتبط موجود را بازیابی کند و در عین حال هیچ یک از مدارک غیرمرتبط را را نیز ارائه ندهد. اما رسیدن به چنین آرمانی عملاً غیرممکن است، و در واقع این مسئله یکی از مهم‌ترین تفاوت‌های میان نظام‌های ذخیره و بازیابی اطلاعات و نظام‌های مدیریت پایگاه داده‌ها را تشکیل می‌دهد. جامعیت و مانعیت با یکدیگر رابطه‌ای معکوس دارند، یعنی هر گونه تلاشی برای افزایش مانعیت منجر به کاهش جامعیت و هرگونه کوششی برای افزودن جامعیت باعث کاهش مانعیت می‌شود. بنابراین، در عمل باید به نسبتی معقول میان این دو رسید. نیاز استفاده‌کننده یکی از عوامل مؤثر در تعیین این نسبت است.

منابع مورد استفاده

Ø  بیزا- ییتس، ریکارد؛ ریبرو- نتو، برتیه(1385). قلمروهای نو در بازیابی اطلاعات. ترجمه علی حسین قاسمی، سیروس آزادی، و علی جوامع. تهران: چاپار.

Ø  پائو، میراندالی(1379). مفاهیم بازیابی اطلاعات. ترجمه اسد الله آزاد، رحمت الله فتاحی. مشهد: دانشگاه فردوسی.

Ø  مهراد، جعفر؛ کلینی، سارا.“بررسی مدل فضای برداری در بازیابی اطلاعات“.فصلنامه کتابداری و اطلاع رسانی. 38.جلد دهم. شماره دوم.(تابستان 1386).صص. 197-210.

Baeza-Yates, Ricardo; Ribeiro-Neto(1999), Berthier. Modern information retrieval. New York: Addison-wesley.

Salton, Gerard(1968).Automatic information organization and retrieval. New York: mc Graw - hill.

 

+ گروه کتابداری ارشد ; ٧:٤۳ ‎ب.ظ ; ٥ دی ۱۳۸٩
comment نظرات ()