کتابداران

این وبلاگ متعلق به دانشجویان کتابداری کارشناسی ارشد ورودی 89 دانشگاه تهران شمال می باشد.

Marc

«به نام خدا»

عنوان تحقیق: مارک (مارک 21، هستهی دوبلین، طرح کدگذاری متن، خدمات مکانیابی اطلاعات دولتی و مارک ایران)

نام درس: ذخیره و بازیابی اطّلاعات

استاد محترم: سرکار خانم دکتر مهردخت وزیرپور کشمیری

تهیّهکننده: ناهید علیزلفی

پائیز 1389

 

مقدّمه

عصر کنونی ما، عصر فناوری اطلاعات و ارتباطات در همه‌ی زمینه‌های دانش بشریست و حوزه‌ی کتابداری و اطلاع‌رسانی نیز از این تحولات به دور نمانده است.

در دوره‌ی کنونی ایجاد ابرداده برای ردیابی منابع گسترده‌ی الکترونیکی جهت اداره و سازماندهی منابع اینترنتی، به عنوان یک روش علمی مؤثر مورد استفاده قرار گرفته است.

در بسیاری از بحث‌های مربوط به فراداده، بویژه در حوزه‌ی مدیریت اطلاعات (از دیدگاه علم کتابداری و اطلاع‌رسانی)، تمایل به گروه‌بندی عناصر فراداده‌ای بر اساس کارکردهایی که این عناصر پشتیبانی می‌کنند، وجود دارد.

 

ابرداده (Metadata) چیست؟

داده درباره‌ی منابع اطلاعاتی؛ داده‌هایی منظم، دقیق و نظام‌یافته برای شناسایی، توصیف و مکان‌یابی منابع الکترونیکی در محیط شبکه.

    اساس کاربرد ابرداده:

   مکان‌یابی، جست‌وجو، بازیابی، مستندسازی، ارزیابی و انتخاب منابع شبکه‌ای است؛

   که افزایش دقت بازیابی منابع شبکه‌ای را نیز سبب می‌شود.

   کاربرد ابرداده:

  • ü نظم‌بخشیدن به منابع اطلاعاتی موجود در اینترنت؛ چگونگی دسترسی به منابع؛ و نیز استفاده از آنها از طریق مستندسازی محتوا، کیفیت، و ویژگی‌های اطلاعات است.

 

قالب‌های ابرداده‌ای معروف

  • Ø قالب MARC(1971 م.)؛
  • Ø قالب UNIMARC(1977 م.)؛
  • Ø قالب USMARC (1981 م.)
  • Ø قالب ابرداده‌ای طرح کدگذاری متن Text Encoding Initiative (TEI) (1994 م.)؛
  • Ø قالب ابرداده‌ای خدمات مکان‌یابی اطلاعات دولتی Government Information Locator Service (GILS) (1994م.)؛
  • Ø قالب ابرداده‌ای هسته‌ی دوبلین (Dublin Core) (1995 م.)؛
  • Ø قالب MARC21 (2000 م.)؛
  • Ø و قالب مارک ایران (فرمت ملی مارک برای ایران 1377 ش. / 1998 م.).

 

قالب MARC21

  • واژه‌ی MARC از شروع کلمات Machine-Readable Cataloging به معنی فهرست‌نویسی ماشین‌خوان است، نظام برچسب‌گذاری عناصر کتابشناختی برای ذخیره‌ی الکترونیک است و با استفاده از آن یک رایانه می‌تواند داده‌های ماشینی را بخواند و تفسیر کند.
  • مارک در واقع یک قالب است که این قالب امکان خواندن و پردازش اطلاعات فهرست‌نویسی هر اثر مشخص را به وسیله‌ی رایانه فراهم می‌کند. یعنی اجزای تشکیل‌دهنده‌ی هر پیشینه تجزیه شده و رایانه به وسیله‌ی نشانه‌ای که برای هر جزء قرار گرفته و برچسب نامیده می‌شود، آن جزء را شناسایی می‌کند و می‌خواند و برابر دستور بر روی آن عمل می‌کند.
  • در حال حاضر در کتابخانه‌ها ویرایش (نسخه) 21 مارک مورد استفاده قرار می‌گیرد، که از تلفیق USMARC و CANMARC است.

 

اهداف کلّی مارک

  • ü طراحی استانداردهایی برای استفاده‌ی بهینه از کامپیوتر در جهت تبادل داده‌ها و اطلاعات کتابشناختی در بین کتابخانه‌ها؛
  • ü طراحی روش‌هایی برای پردازش داده‌های کتابشناختی که به کمک آنها عملیات فهرست‌نویسی منابع با سرعت و کارایی بیشتری صورت پذیرد؛
  • ü امکان دستیابی کاربران به داده‌های کتابشناختی و منابع اطلاعاتی در هر مکان و به هر شکل ممکن.

 

امکانات مارک

  • v می‌توان هر رکورد را تحت یک یا چند سرعنوان درخواستی (سرشناسه‌ها یا شناسه‌های افزوده) چاپ و همه‌ی مدخل‌ها را به هر شکل دلخواه (مثلاً فهرست پدیدآور، فهرست رده‌ای و...) مرتب کرد؛
  • v فهرست‌ها را با افزایش داده‌های جدید به بایگانی مرکزی، به شکل خودکار روزآمد ساخت؛
  • v اطلاعات مورد نیاز را از رکوردهای وارد شده بر حسب تقاضا استخراج کرد؛
  • v شکل نهایی فهرست یا فهرست‌ها را در قالب‌های رسانه‌ای مورد نیاز (چون میکروفیلم، برگه، شکل کتابی و...) تهیه کرد؛
  • v فرمت تبادلی برای رکوردهای فهرست شده بین یک کتابخانه و سایر کتابخانه‌ها فراهم ساخت.

 

ساختار رکورد مارک

اطلاعات کتابشناختی فهرست‌برگه‌ها برای تبدیل به یک رکورد، با استفاده از نشانه‌های معین برای خواندن به وسیله‌ی رایانه آماده و کدگذاری می‌شوند و اطلاعات کدگذاری شده، توسط رایانه پردازش می‌شود.

  • q یک رکورد مارک از چهار بخش اصلی تشکیل گردیده است:
  • — برچسب رکورد (Leader): شامل عنصر داده‌ای است که دارای مقادیر یا ارزش رمزی است و با موقعیت کاراکترهای وابسته شناسایی می‌ شود. لیدر دارای طول ثابت (24 نویسه یا کاراکتر) است و در ابتدای هر رکورد می‌آید.
  • — فهرست راهنما: به دنبال برچسب رکورد می‌آید. هر مدخل فهرست راهنما، به یک فیلد تعلق دارد و مرکب از سه جزء است:

            یک عدد 3 رقمی به عنوان شماره‌ی فیلد(tag) ؛

            یک عدد 4 رقمی که طول فیلد داده‌ای را نشان می‌دهد؛

            و یک عدد 5 رقمی که نشانی محل آغاز داده‌های همان فیلد را به رایانه نشان می‌دهد.

 فیلدهای دادهای (Fields): به دو نوع فیلدهای با طول ثابت و فیلدهای با طول متغیر می‌باشند.

  • — نشانگر (Indicator): یک نویسه‌ی عددی یا الفبایی که اطلاعات اضافی در ارتباط با فیلد متغیر، محتوای آن فیلد، رابطه‌اش با فیلدهای دیگر همان رکورد و یا نحوه‌ی دستکاری اطلاعات را ارائه می‌دهد.
  • —

قالب ابرداده‌ای Dublin Core

  • § الگویی منسجم و جامع، با تضمین سهولت تولید رکوردهای ابرداده‌ای است.
  • § استاندارد فراداده‌ای هسته‌ی دوبلین، طرحی بین‌المللی و میان‌رشته‌ای است که مجموعه‌ی عناصری ساده و کارآمد را برای توصیف طیف گسترده‌ای از منابع اطلاعاتی شبکه‌ای ارائه می‌دهد.
  • q این طرح دارای دو سطح توصیف است:
  • ü سطح اوّل (ساده) شامل پانزده عنصر هسته؛
  • ü سطح دوّم (مقید به توضیحگر) دارای هفت عنصر علاوه بر پانزده عنصر سطح ساده.

 

وظایف اصلی عناصر دوبلین کور

  • v شناسایی (عناصر: تاریخ، نوع منبع، قالب، شناسگر)؛
  • v یافتن (عناصر: عنوان، پدیدآورنده، همکاران، موضوع، زبان، پوشش و قالب منبع)؛
  • v انتخاب (عناصر: توصیف، پوشش)؛
  • v دسترسی (عنصر: شناسگر).

 

ویژگیهای دوبلین کور

ویژگی‌هایی که باعث ممتازشدن آن به عنوان یک قالب ابرداده‌ای شده است:

  • v سادگی ایجاد و نگهداری آن؛
  • v روابط معنایی شناخته شده؛

    به طور مثال برای Author و Artist = Creator (تفاهم روی یک واژه)؛

  • v گسترش دامنه‌ی بینالمللی؛

     بدین معنا که ابتدا به زبان انگلیسی ایجاد شد، ولی به دلیل مزایای آن و  نیازهای زبان‌های دیگر نسخه‌هایی از آن به زبان‌های دیگر تهیه شد؛ ‌

  • v توسعهپذیری؛

       به دلیل سادگی توصیف منابع دیجیتال و بازیابی جامع و دقیق آن.

 

مارک ایران

  • — نخستین بررسی‌ها بر روی فرمت مارک ایران در 1946 م. انجام و در آن فرمت یونی‌مارک به عنوان مبنای گسترش مارک ایران پیشنهاد شد.
  • — مارک ایران، فرمتی است برای ذخیره، بازیابی و تبادل اطلاعات کتابشناختی که بر مبنای استانداردهای بین‌المللی توصیف کتابشناسی (آی.اس.بی.دی.) و با در نظر گرفتن ویژگی‌های فهرست‌نویسی فارسی بر اساس فرمت یونی‌مارک طراحی شده است.
  • — دستنامه‌ی مارک ایران به عنوان نخستین تجربه‌ی کتابخانه‌ی ملی فقط برای تک‌نگاشت‌ها تهیه شده است و پیایندها، مواد دیداری و شنیداری، مواد جغرافیایی، و فایل‌های رایانه‌ای را دربر نمی‌گیرد.

منابع:

  • ب‍ررس‍ی‌ م‍س‍ائ‍ل‌ ف‍ه‍رس‍ت‌‍ن‍وی‍س‍ی‌ م‍ن‍اب‍ع‌ ای‍ن‍ت‍رن‍ت‍ی‌ و ارائ‍ه‌‌ی دس‍ت‍ن‍ام‍ه‌ی‌ پ‍ی‍ش‍ن‍ه‍ادی‌ ب‍رای‌ ک‍ت‍اب‍خ‍ان‍ه‌ه‍ای‌ ای‍ران‌ [پ‍ای‍ان‌ن‍ام‍ه‌] / ن‍گ‍ارش‌ م‍ح‍س‍ن‌ ح‍اج‍ی‌ زی‍ن‌ال‍ع‍اب‍دی‍ن‍ی؛ ‌اس‍ت‍اد راه‍ن‍م‍ا رح‍م‍ت‌الله‌ ف‍ت‍اح‍ی؛ ‌اس‍ت‍اد م‍ش‍اور ف‍اطم‍ه‌ (ب‍ه‍ار) ره‍ادوس‍ت‌.- ت‍ه‍ران: 1381.
  • دایره‌المعارف کتابداری و اطلاع‌رسانی. سرویراستار عباس حرّی؛ ویراستار همکار نرگس نشاط؛ دستیاران علمی محمّدحسن رجبی، نرگس نشاط.-‌ تهران: کتابخانه‌ی ملی جمهوری اسلامی ایران، 1381-1385. مقاله‌ی آقای مرتضی کوکبی.
  • شفیعی علویجه، سیما، نگاهی بر ابرداده و مفاهیم آن، با تأکید بر سیر تحول و انواع طرح‌های ابرداده‌ای.
  • صفری، مهدی. "ابرداده و کاربرد آن در سازماندهی منابع وب با تأکید بر عناصر ابرداده‌ای دوبلین‌کور در بستر نحوی Html". فصلنامه‌ی کتاب. ش 55 (پائیز 1382).
  • مایچان، لوئیس. فهرستنویسی و ردهبندی. مترجمان زهیر حیاتی، هاجر ستوده.- تهران: نشر کتابدار، 1385.
  • مارک ایران. تدوین کمیته‌ی ملی مارک ایران. تهران: کتابخانه‌ی ملی جمهوری اسلامی ایران، 1381.
  • http://en.wikipedia.org/wiki/Dublin_Core
  • http://www.loc.gov/marc/marc2dc.html
  • http://dublincore.org/
  • http://www.ietf.org/rfc/rfc2413.txt
  • http://www.loc.gov/marc/bibliographic/
  • http://www.loc.gov/marc/

http://en.wikipedia.org/wiki/MARC_standards

لینک صفحه