کتابداران

این وبلاگ متعلق به دانشجویان کتابداری کارشناسی ارشد ورودی 89 دانشگاه تهران شمال می باشد.

ذخیره و بازیابی تصاویر در وب

ذخیره و بازیابی تصاویر در وب


مقدمه

تا همین اواخر مجموعه تصاویر دیجیتالی به علت محدودیت هایی که در تجهیزات و وسایل چاپ و پخش داشتند زیاد مورد استفاده قرار نمی گرفتند . اما با ورود فناوری های نوین کاربران توانستند به طور مؤثری تصاویر را ذخیره و بازیابی کنند. پایگاه های اطلاعاتی تصاویر دیجیتالی و فناوری های پردازش تصویر طی چند سال گذشته به طور چشمگیری توسعه یافته است. پایگاه های اطلاعاتی تصاویر درحال فراهم آوردن دسترسی مؤثر به مجموعه تصاویر هستند. به منظور دسترسی و استفاده از تصاویر، کاربران نیازمند ابزارهای مطمئنی هستند و به علت حجم زیاد اطلاعات جستجوی تصاویر در وب شبیه گشتن به دنبال یک سوزن در انباری از کاه است. ابزاری که می تواند کاربران را کمک کند تا تصاویر مورد نظر خود را بازیابی و جایابی کنند، موتورجستجوی تصویر است کاربران اینترنتی با تجربه، پرسش خود را با موتورهای جستجوی تخصصی به منظور به دست آوردن نتایج مطلوب شروع می کنند، و زمانی از موتورهای جستجوی عمومی برای پرسش خود استفاده می کنند که موتورهای جستجوی تخصصی نتوانند اطلاعات مفید راجع به پرسش مورد نظرشان بدهد .

 

نمایه سازی تصویر

به خاطر حجم زیاد منابع تصویری، استفاده کننده برای یافتن تصویر علاوه بر موتورهای جستجو، به یک نمایه جامع از تصاویر اینترنت نیاز دارد که بدون آن بازیابی تصویری خاص از اینترنت می تواند خیلی دشوار و زمان بر باشد.

ویژگی ها و خصوصیات منحصر به فرد تصاویر نسبت به سایر منابع اطلاعاتی، کار نمایه سازی تصاویر را با چالش های زیادی مواجه ساخته است . دو فاکتور به هم مرتبط، مجموعه تصاویر را از منابع متنی جدا می کند:

 1) بسیاری از تصاویر  ماهیت چند رشته ای دارند و احتمال دارد که توجه محققان رشته های مختلف را به خود جلب کنند.

 2) تصاویر بر خلاف کتاب و دیگر اسناد ، با عنوان و مقدمه یا چکیده توصیف نمی شوند؛ این باعث می شود فرد به برداشت شخصی خود از تصویر و محتوای موضوعی آن متکی باشد .انتخاب نوع نظام نمایه سازی از دیگر مواردی است که می توان به آن اشاره کرد .بنابراین، روشن است که نمایه سازی تصاویر فعالیتی آسان و ساده نیست. فراهم کردن نقاط دسترسی متعدد برای کاربرانی که قصد دارند تصاویر را بازیابی کنند مستلزم هزینه فراوان و فعالیتی مداوم است و همه می دانیم که"یک تصویر شاید بهتر از هزاران کلمه باشد، ولی این احتمال وجود دارد که هزاران توصیفگر برای نشان دادن محتوای یک تصویر، کفایت نکند"

 

روش های نمایه سازی تصاویر

ذخیره و بازیابی تصاویر از دهه1970 به بعد به نوعی مقوله پژوهشی فعال تبدیل شده و پژوهشگران دو حوزه مدیریت پایگاه اطلاعات و حوزه  رایانه دراین زمینه به فعالیت پرداخته اند .هریک از این  دو گروه با استفاده از برخی ویژگی ها ی تصاویر کوشیده اند تا دسترسی کاربران را به این منابع فراهم سازند. کتابداران و نمایه سازان که به عنوان مدیران پایگاه های اطلاعاتی به شمار می آیند بیشتر به ویژگی های متنی تصویر می پردازند، یعنی رویکردی مبتنی بر متن دارند . روش دیگر به ویژگی های محتوای تصویر می پردازد، یعنی رویکردی مبتنی بر محتوا دارد.

 

 

شیوه بازیابی تصاویر برروی وب

اطلاعات مورد نیاز برای یافتن تصاویر بر روی وب جهان گستر را به طور کلی از دو منبع می توان به دست آورد:

 متن مربوط به تصویر و خود تصویر.

 هنگام استفاده از اطلاعات این دو منبع، برنامه ای باید بتواند با موفقیت تصاویر درخواستی را بازیابی کند که آن برنامه موتورهای جستجوی تصاویر هستند.

 در نظام مبتنی بر متن اطلاعات مریوط به متن خود تصویر بر اساس موقعیت هایشان رده بندی می شوند که بر اساس گروه های زیر است:

1.       نام فایل تصویر

2.       عنوان تصویر  

3.       برچسب  HTML: عنوان HTML سند ( در بالای صفحه نمایش، توسط مرورگر نشان داده می شود، که برای فهرست های تاریخی و غیره به کار برده می شود)، اغلب اطلاعاتی درباره محتوای تصاویری که در داخل سند قرار دارند فراهم می آورد.

4.       فرا پیوندها: متن یک فرا پیوند معمولا˝ عبارات کلیدی را پیرامون آنچه یک پیوند به آن ارجاع می دهد، نشان می دهد. در بسیاری از موارد تصاویر، به جای این که در داخل متن صفحه جاسازی شوند به وسیله فرا پیوندها به آنها اشاره می شود (متن پیوندها به یک تصویر از سوی وبگاه ها توسط موتورهای جستجو به عنوان موضوع تصویر پیوند شده در نظر گرفته می شود).

5.       متون دیگر: علاوه بر موارد ذکر شده در بالا متون دیگر می تواند راهنمایی در مورد تصویر موجود در صفحه بدهد. این متن می تواند برای نمایه سازی تصاویر در صفحه، با احتمال کمتری نسبت به دیگر دسته های متنی که در بالا ذکر شدند، بکار برده شود.

 اطلاعات مرتبط  دیگری که می توان به طور مستقیم از محتوای خود تصاویر کسب کرد، شامل موارد زیر است:

§         سیاه و سفید در برابر رنگی : گاهی ممکن است فقط تصاویر رنگی را بخواهید. در حالی که تصاویر رنگی می توانند به سیاه و سفید برگردانده شوند، آنهایی که تصاویر سیاه و سفید را جستجو می کنند، چیزهای واقعی را می خواهند.

  • اندازه تصویر : معمولا˝ برای افرادی که می خواهند تصاویر را به روی پرده به اندازه مشخصی کوچک تر نشان بدهند، مفید است.
  • نوع فایل (JPEG,GIF
  • اندازه فایل؛
  • تاریخ فایل :  اگر کسی در جستجوی تصاویر جدیدتر باشد، تاریخ می تواند برای نشان دادن تصاویری که حتما˝ از زمان مشخصی قدیمی تر هستند استفاده شود.

به دست آوردن اطلاعات فراتر از آنچه که در بالا ذکر شد، نیاز به تحلیل تصویر دارد. روش های مفیدی که برای تحلیل تصویر به کار برده می شود به سه دسته زیر تقسیم می شوند:

1.       رده بندی تصویر به یک یا چند نوع (مانند عکس، طراحی دستی، طراحی کامپیوتری).

2.       تشخیص ساختار تصویر(مانند صورت، لبه ها).

3.       تمایز قائل شدن بین نواحی خاص  به وسیله ویژگی های رنگ/ متن (مانند: پوست، آسمان، برگ درختان).

 

بازیابی و نمایه سازی تصاویر مبتنی بر محتوا

در این نظام به جای نمایه سازی دستی تصاویر، آنها را با استفاده از محتوای بصری نمایه سازی می کنند. ذخیره و بازیابی تصاویر از طریق استخراج خودکار ویژگی ها و مشخصات اصلی تصویر مانند رنگ ، شکل و موقعیت مکانی صورت می گیرد  

ویژگی های تصویری که با روش مبتنی بر محتوا تحلیل می شوند به سه سطح زیر قابل تقسیم هستند:

1.       ویژگی های اصلی و اولیه تصویر مانند: رنگ،شکل؛

2.       ویژگی های منطق نظیر موجودیت اشیاء نمایش داده شده در تصویر؛

3.       ویژگی های خاص تصویر مانند مفهوم و معنای تصویر

 

در بازیابی تصاویر مبتنی بر محتوا سؤال کاربر به دو شیوه تقسیم می شود:

1.       به صورت یک تصویر، مشابه با آنچه که مورد نیاز است و از قبل با هدف تطبیق کردن، در سیستم وجود دارد بازیابی می شود.

2.       به صورت یک سؤال ، ساختار مورد دلخواه خواسته شده را شرح می دهد.

  

  

کاربردهای بازیابی تصاویر

از زمان پیدایش وب جهان گستر از  لحاظ تعداد و دامنه صفحات ، رشد زیادی داشته است،  به طوری که امروزه تعداد آن چندین میلیارد برآورد می شود.

 

حقوق معنوی

یکی از کاربردهای بازیابی تصاویر می تواند برای حمایت از حق صاحب امتیاز تصویر باشد. به علت گسترش سریع تصاویر حقوق مالک در وب، حیاتی است. یکی از روش های موجود استفاده از نشانه گذاری دیجیتالی است. که با اضافه کردن برچسب یا توصیف گر برروی تصویر، مانع از استفاده غیر قانونی آن می شوند .اگر چه این روش برای پردازش تصویر و شکست هندسی تصویر مضر است، استفاده از این روش زمان شناسایی تصاویر را بالا می برد.

1.       فیلتر کردن مواد بالغین

امروزه تصاویر غیر اخلاقی فراوانی در وب وجود دارد که دسترسی به این نوع تصاویر برای کودکان و حتی بالغین در برخی فرهنگ ها، دغدغه اصلی افراد است. در سال های اخیر پژوهشگران، به استفاده از تکنیک های تصویر مجازی در رایانه، رو آورده اند که به طورخودکار تصاویر مربوط به مسائل جنسی را تشخیص می دهد.  این روش از یک الگوریتم ویژه ای برای تشخیص افراد برهنه در تصویر استفاده می کند.

2.       اجرای قانون

بازیابی تصاویر بر اساس محتوا کاربردهای گوناگونی در اجرای قانون و جلوگیری از وقوع جرایم دارد، مثل تشخیص اثر انگشت، تشخیص چهره، تطبیق دی ان ای و شناسایی رد پا  و نظام های نظارتی بسیاری از افراد از اینترنت برای فروش و به نمایش گذاشتن کالاهای غیر قانونی خود مثل مواد مخدر، قاچاق اسلحه و... استفاده می کنند. چون این گونه وبگاه ها دارای اطلاعات دیداری زیادتری نسبت به اطلاعات متنی هستند، تکیه بر روش های بازیابی متنی در این مورد نمی تواند کافی باشد . استفاده از نظام های مبتنی بر متن و همچنین نظام های مبتنی بر محتوا می تواند کمک شایانی به شناسایی این گونه وبگاه ها نمایند.

3.       مسافرت و گردشگری

مردم قبل از مسافرت به مکانی خاص، خواهان آن هستند که  اطلاعات بیشتری راجع به آن مکان به دست آورند. اطلاعات ممکن است شامل دیدن نقشه یک کشور یا شهر باشد که اطلاعات گردشگری راجع به آن محل را ارائه می دهد. هیچ شیوه ای بهتر از استفاده از اینترنت، که دارای تصاویر زیادی از کشور های جهان است وجود ندارد. اما ابزاری برای بازیابی تصاویر در اینترنت لازم است. به علاوه فهرست تصاویر موجود در اینترنت می تواند مسافران را در یافتن اطلاعات موردنظر کمک کند

آموزش

آموزش یکی از کاربردهای مهم تصاویر در اینترنت است. اکثر دانشجویان برای انجام پژوهش به دو دلیل نیازمند تصاویر هستند:

 1. به عنوان منبع اطلاعاتی ( به عنوان نمونه تعیین قلمرو ایران در دوران قاجاریه)

 2. برای تشریح نظرات خویش با استفاده از تصویر. بسیاری از این گونه تصاویر در اینترنت وجود دارد و دانشجویان می توانند آنها را جستجو و بازیابی کنند. البته مسئٔله اصلی نحوه نمایه سازی و بازیابی تصاویر از طریق اینترنت است و استفاده از موتورهای جستجو این مشکل را تا حدوی بر طرف کرده است .

 

 

معرفی موتورهای جستجو تصاویر

 

www.Google.com

پایگاه قدرتمند گوگل با داشتن بیش از 250 میلیون تصویر قابل مشاهده در فهرست خود، در حقیقت یکی از جامع ترین مجموعه ها  در کل جهان وب است. این مجموعه فوق العاده غنی و به روز می تواند برای بسیاری از کاربران در زمینه های مختلف مفید و ارزنده باشد. در واقع بسیاری از گروه های مختلف می توانند با توجه به اهمیت نیاز به استفاده از تصاویر مورد نظر در رابطه با کارهای خود ، از این سرویس استفاده کنند . برای استفاده از قابلیت جستجوی تصاویر، دکمه تصویرها را در صفحه اصلی انتخاب کرده و بعد عبارتی را در جعبه جستجوی تصویر وارد کنید و سپس کلمه جستجو را انتخاب کنید. پس از مدتی تصویر کوچک شده مورد نظر خود را انتخاب کنید تا روایت بزرگ تری از تصویر و همچنین صفحه ای که تصویر در آن قرار دارد، مشاهده کنید . این موتور جستجو به علت استفاده از نمایه سازی خاص خویش، یکی از پرکاربردترین موتور های جستجو تصویر در وب است. دیگر ویژگی های گوگل شامل موارد زیر است :

  • یافتن اطلاعات آماری در موتور سخت است؛
  • نتایج یافته ای آن بیشتر و امکان رؤیت تصاویر هم بیشتر است؛
  • دارای جستجوی ساده و پیشرفته و جستجو از طریق عملگرهای بولین؛
  • امکان محدود کردن جستجو برای مواد بالغین دارد؛
  • 20 تصویر کوچک در ابتدا و اطلاعات فایل مفصل دارد؛
  • با گزینهmore  اجازه دستیابی بیشتر به مواد رامی دهد؛
  • دارای  online help ، هیچ راه ارتباطی برای بر قراری ارتباط در مواد خاص وجود ندارد

 

  www.Yahoo.com

 یاهو تا فوریه سال 2004 به عنوان یک راهنمای وب، بیشتر نتایج جستجوی خود را از طریق گوگل انجام می داد. اما در خلال سال های 2003- 2004 با برخی خریدهای راهبردی، یاهو خود را به عنوان یک موتور جستجوی مهم مطرح کرد و بعد از آن به عنوان یک رقیب جدی گوگل شناخته شد. ویژگی های این موتور جستجو شامل موارد زیر است:

  • راهبردهای موتورهای جستجو به سختی قابل رﺅیت است؛
  • یا هو بلاگ از نمایه شدن 16000000 عکس تا اگوست 2006 خبر داد؛
  • جستجوی ساده و پیشرفته عبارتی را شامل شده ولی کوتاه سازی را ندارد؛
  • یافته ها با توجه به اندازه و رنگ و... قابل محدود شدن است؛
  • اجازه محدود کردن تصاویر بالغین را می دهد؛
  • با also tryاجازه اخص کردن جستجو را می دهد؛
  • 20 قطعه عکس کوچک، اطلاعات کامل فایل،  بیانیه مبتنی بر کپی رایت 

www.picsearch.com

پیک سرچ یک کمپانی سوئدی است که در سال 2000 راه اندازی شد، که سایت های دیگر را نیز پشتیبانی می کند. ویژگی هایی که این موتور جستجو را از دیگر موتورهای جستجو جدا می کند، شامل موارد زیر است:

  • مختص جستجوی تصویر است؛
  • دارای حذف خودکارمواد مربوط به بالغین؛
  • اجازه دسترسی به حجم وسیعی ازیافته (به ادعای خود سایت) دارد؛
  • این موتور علاوه بر موارد بالا دارای ویژگی های زیر نیز است:
  • دارای جستجو ساده و پیشرفته و جستجو از طریق عملگرهای بولین؛
  • در ربط یافته ها بسیار خوب است؛
  • پیوندهای کور و تصاویر حذف شده وجود دارد؛
  • دارای بیانیه حق مؤلف؛
  • امکان برقراری ارتباط از طریق ایمیل

 

www.Ditto.com

این سایت جهت جستجوی تصاویر خود به پیک سرچ متصل می شود. ویژگی های آن شامل موارد زیر است:

  • دارای گزینه جستجوی ساده و پیشرفته است؛
  • تصاویر به صورت ریز به پیوند اصلی ارجاع داده می شود ؛
  • سعی در رعایت کامل قانون کپی رایت دارد

 

www.corbis.com

این سایت توسط مایکروسافت در سال 1989 راه اندازی شد. کوربیس دارای مجموعه های بزرگ تصویری و هنری است. در سال 2003 سعی در رسیدن به کاربران غیر اقتصادی از طریق یاهو و گوگل را داشت اما اکنون رابط خود را به دو صورت طراحی کرد که شامل اشخاص و افراد حرفه ای می گردید اما در سال 2006 رابط آن محدود به استفاده افراد حرفه ای گردید.

ویژگی های این سایت شامل موارد زیر است:

  • مجموعه روز آمد، وسیع و دارای 70 میلیون تصویراست
  • کامل ترین نوع جستجو را در بین موتورهای جستجو داراست؛
  • شامل عملگرهای بولین، جستجوی عبارتی و ترکیبی، محدود شدن جستجو به فهرست، مجموعه، تاریخ اضافه شدن، کیفیت نوع عکس، اجازه استفاده عبارت کوتاه سازی پرسش؛
  • نتایج سریع، وسیع، مرتبط و با کیفیت بالا هستند؛
  • اجازه رؤیت تمام تصاویر داده می شود؛
  • دارای بیانیه کپی رایت، عکس های بزرگ تر و نشانه گذاری دیجیتالی هستند؛
  • دارای گزینهonline help ، همچنین امکان برقراری ارتباط از طریق ایمیل است  .

 

 

www.webshots.com

این سایت یک آلبوم عکس جامعی بوده که دارای یک رویکرد اقتصادی است. عکس های اینترنتی اعضا توسط خود آنها ذخیر ه شده و این عکس ها برای جستجو، تماشا و در برخی موارد خرید دیگران، در دسترس آنان قرار می گیرد.

سایر ویژگی های این سایت عبارتند از :

  • ادعای داشتن 360 میلیون عکس را دارد؛
  • شامل تصاویر مربوط به بالغین است؛
  • در برخی از موارد در اصطلاح های عمومی همپوشانی مناسبی نسبت به موضوعات خاص وجود دارد 

 

 

 

نتیجه گیری

رشد سریع در تعداد تصاویر منتشر شده بر روی وب، پیدا کردن تصاویر خاص را بسیار مشکل کرده است . تا جای که بیش از 180 میلیون تصویر بر روی صفحات وب وجود دارد و این در حالی است که هر روز بیش از یک میلیون تصویر دیجیتالی به صفحه های  وب  اضافه می شوند. برای به دست آوردن تصاویر مفید، کاربران نیاز دارند یک ابزار جستجوی کارآمد و با کفایت به کار برند که آنها را برای بازیابی آنچه که آنها از مجموعه بزرگ تصویر نیاز دارند کمک کند. برخی از خصوصیات یک موتور جستجوی ایده ال تصویر را می توان چنین مطرح کرد:

1.       امکان جستجوی کلید واژه ای از محتوا، تاریخ، و تولید کننده تصویر را بدهد؛

2.       به کاربران امکان جستجوی با رنگ، شکل، و دیگر ویژگی های شکلی را بدهد؛

3.       امکان نمایش تصویر به عنوان بخشی از نتایج جستجو را داشته باشد؛

4.       به استفاده کننده امکان یافتن صاحبان اثر را بدهد؛

5.       امکان جستجوی درونی اثر از پایگاه های اطلاعاتی به سایت های اطلاعاتی را داشته باشد؛

6.       شیوه نامه های حقوقی به منظور تهیه مجوز را آماده کند.

تکنیک جستجوی مناسبِ مورد استفاده در موتورهای جستجوی تصویر، در محیط وب جهان گستر، بر مبنای کلمات کلیدی است .

 

 

 

 

 

 

 

 

  منابع

صفی نیا، سینا. (1381) ." توانایی ها و قابلیت های مخصوص گوگل : جستجوی تصاویر ، بررسی ساختار و تکنیک جستجو" .دانش و کامپیوتر، سال سوم ، شماره 22.ص 19

عباس پور ، جواد. (1384)." نمایه سازی تصاویر ، چالش و رویکردها".کتابداری ،سال نهم ، دفتر چهل و چهارم .ص 167-177

کرمی ،افسانه. (1385) . نمایه سازی تصویر در پایگاههای اطلاعاتی                                .                          :

نعمت زاده ، نسیم ؛ صفا بخش ، رضا. (1382). بازیابی مبتنی بر رنگ تصاویر بر اساس محتوا .

 

   Beigi, Mandis; B.Benitez, Ana; Fu Chang, Shih(1998)."MetaSEEk: A Content-Based Meta- Search Engine for Images". Department of Electrical Engineering & New Media Technology Center Columbia University , New York , NY 10027

Eakins J.P; Grahmm. E(1999)"Content Based Image Retrival". A Report to the JISC Technology Application Program .University Of Northumbbia AtNewcastle,U.K

      El – Qawasmeh, Eyas(2003).”A quadtree –based representation technique for indexingand retrieval of image databases”.J. Vis. Commun. Image R. 14. pp. 340-357[on-line].available at:

     Hassan , Ibrahim ; Zhang, Jin(2001)."Image search engine fauture analysis". Online Information Review.25(2). pp. 103-114.[on-line].available at:

+ گروه کتابداری ارشد ; ۱٢:٤٩ ‎ب.ظ ; ۸ دی ۱۳۸٩
comment نظرات ()