کتابداران

این وبلاگ متعلق به دانشجویان کتابداری کارشناسی ارشد ورودی 89 دانشگاه تهران شمال می باشد.

metadata

 

—تاریخچه
—اصطلاح ابرداده اولین بار توسط یک شرکت امریکایی در سال 1969 به کار رفت. اما کاربرد آن به طور عمده به دهه 1990و شکل گیری شبکه وب در سال 1993 باز می گردد.جایی که دمپسی و هیری در طرح تحقیقاتی خود 22 قالب ابرداده ای رایج را بررسی و در گزارش خود از انواع قالبهای ابرداده ای شکل گرفته در دهه های 1960, 1970و1980 به عنوان اولین قالبهای ابرداده ای یاد می کنند.
—تعریف Metadata
—واژه metadata از ریشه لاتین meta به معنی ماهیت و data به معنی اطلاعات یا داده گرفته شده است.
—ابرداده((metadata هر نوع اطلاعات توصیفی ساختاریافته درباره دیگر داده ها که برای شناسایی, توصیف, مکان یابی و مدیریت منابع شبکه ای است. در واقع همانطور که فهرستها در کتابخانه برای جستجو, سازماندهی و بازیابی منابع کتابی و غیره مورد استفاده قرار می گیرد ابرداده نیز نوعی روش و ابزار برای فهرستنویسی, سازماندهی و بازیابی منابع الکترونیکی در شبکه اینترنت است
—
—
<
HEAD>
<TITLE> The Library of Congress</TITLE>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html;
charset=iso-8859-1">
<BASE HREF="http://www.loc.gov/homepage/">
<META NAME= "description" CONTENT="Home page of the Library of Congress, Washington, D.C. The Library of Congress is the nation's oldest federal cultural institution, and it serves as the research arm of Congress. It is also the largest library in the world, with more than 120 million items on approximately 530 miles of bookshelves. The collections include more than 18 million books, 2.5 million recordings, 12 million photographs, 4.5 million maps, and 54 million manuscripts.">
<META NAME= "keywords" CONTENT= "library of congress, home page , catalog, copyright office,
american memory, global gateway, exhibitions, america's library, thomas, national digital preservation program, wise guide, the library today, researchers, librarians, teachers, blind, today in history">
<META HTTP-EQUIV="expires" CONTENT="Wed, 26 Feb 1997 08:21:57 GMT">
<SCRIPT TYPE="text/
javascript">
—

ابر داده سایت وب کتابخانه کنگره آمریکا
—
—شباهتها
—هر دو اطلاعاتی ساختار یافته هستند.
—هر دو توسط افراد بنا به هدف مشخصی ایجاد شده اند.
—هر دو جایگزینی هستند برای شئی واقعی.
—
—تفاوتها
—برگه فهرستنویسی برای کاربران قابل استفاده و رویت است اما ابرداده توسط مرورگرهای وب به نمایش درنمی آید.
—برگه فهرستنویسی ابزاری است برای جستجو, سازماندهی و بازیابی منابع کتابی و غیرکتابی عمدتا فیزیکی در کتابخانه ها اما ابرداده روشی است برای جستجو, سازماندهی و بازیابی در شبکه اینترنت و وب.
—برگه های فهرستنویسی به طور خاص توسط کتابداران وبرای کاربران تهیه می شود ولی ابرداده توسط طراح صفحه وب و برای کمک به بازیابی موثرتر موتورهای کاوش ایجاد شده اند.
—اهمیت Metadata
—رشد و گسترش فناوری و شکل گیری شبکه های اطلاعاتی منجر به گسترش فزاینده منابع الکترونیکی گردید و این مساله ناکارآمدی موتورهای جستجو را در سازماندهی این منابع موجب شده است.
—مشکلاتی که در ارتباط با موتورهای جستجو مطرح هستند عبارتند از:
—1-ممکن است همه اطلاعات مرتبط یافت نشوند زیرا سایتها علاوه بر متون HTML(فرامتن) حاوی منابع دیگری نیز هستند(عکس, بانکهای اطلاعاتی و متون(PDF.
—
—اهمیت Metadata
—2- موتورهای جستجو غالبا تمام صفحات یک سایت را پوشش نمی دهند; اغلب عنوان سایت یا دو یا سه سطر اول را نمایه می کنند.
—3- موتورهای جستجو نمی توانند بین لغات مهم و غیرمهم تمایزی قائل شوند بنابراین ممکن است اطلاعات نامرتبط زیادی بازیابی شوند.
—اهمیت Metadata
—Metadata    یک روش سیستماتیک برای توصیف منابع و در نتیجه بهبود دسترسی به آنهاست. اگر منبعی ارزش قرار گرفتن در وب را داشته باشد پس باید آنقدر ارزش داشته باشد که برای رمزگذاری آن با ابرداده اندکی تلاش کرد.
—بطور کلی همه دلایل مربوط به علت نمایه سازی و فهرستنویسی برای مواد چاپی با شدت بیشتر درباره اهمیت و ضرورت ایجاد ابرداده برای منابع و اطلاعات موجود در وب نیز صادق هستند.
—کارکرد Metadata

براساس آنچه گفته شد دو کارکرد عمده برای ابرداده ها می توان برشمرد:

.1توصیف منبع: ابرداده ها از طریق بیان ویژگیهای منابع به نحوی ساختارمند به توصیف آنها می پردازند.
.2کشف منبع: موتورهای کاوش از طریق نمایه سازی به کشف منابع می پردازند با اینحال بخش زیادی از منابع در شبکه وب توسط موتورهای وب نمایه نمی شوند که اصطلاحا این قسمت از وب را وب نامرئی(invisible web)  نامیده می شود. بنظر میرسد بهترین و موثرترین راه در مرئی نمودن این منابع برای ابزارهای نمایه ساز وب استفاده از ابرداده است.   
—دیگر کارکردهای Metadata
—خلاصه کردن معنای داده ها(داده ها درباره چه هستند؟)
—اجازه دادن به استفاده کننده برای کاوش داده ها و تعیین اینکه آیا داده ها همان چیزی است که نیاز دارد یا نه؟
—جلوگیری از دسترسی برخی استفاده کنندگان(مثلا کودکان) به برخی داده ها
—کمک به تصمیم گیری درباره اینکه چه شکل و قالبی از داده ها بازیابی شوند(در صورت وجود قالبهای متعدد)
—ارائه اطلاعاتی که به استفاده از داده ها کمک می کند(شرایط حقوقی, سن و ...)
—کنترل مدیریت داده ها
—چگونگی ایجاد ابرداده
—برای ایجاد ابرداده دو روش وجود دارد:
.1رمزگذاری همزمان توسط پدیدآورندگان وب در جریان ایجاد صفحات وب
.2رمزگذاری غیرهمزمان که بعد از این که صفحات وب ایجاد شد توسط دیگران صورت می گیرد.

به صرفه ترین روش ایجاد ابرداده همزمان با تولید منبع است زیرا پدیدآورنده وب تنها کسی است که محتویات صفحه وب را به بهترین وجه می شناسد.

—چگونگی ایجاد ابرداده
—امروزه ساده ترین راه به کارگیری ابرداده ها برای توصیف منابع در وب وارد کردن آنها در زبان فرامتن است. چراکه در این صورت نظام دیگری برای استفاده از ابرداده ها مورد نیاز نیست و همچنین ابردادها جزئی از مدارک شده و ممکن است توسط ابزارهای نمایه ساز وب نمایه شوند.کاربردهای کنونی دوبلین کور نیز بیشتر براساس وارد کردن عناصر آن در زبان نشانه گذاری فرامتن است که از طریق ابربرچسب های این زبان انجام می شود.
—ابربرچسب ها(Meta tag) افزودن اطلاعات عمومی درباره محتوای صفحه وب را از طریق زبان HTML امکان پذیر می سازند. این برچسب ها قابل مشاهده نیستند و در ابتدای برنامه HTML  وارد می شوند و توسط موتورهای کاوش شناسایی می شوند.
—انواع طرحهای ابرداده ای
—در حال حاضر صدها طرح و استاندارد ابرداده ای وجود دارد که مهمترین و پرکاربردترین آنها عبارتند از:
—دوبلین کور((Dublin core
—مارک
—استاندارد ابرداده ای دولت الکترونیکی(e-GMS)
—خدمت مکان یاب دولتی اطلاعات(GILS)
—خدمت مکان یاب دولتی استرالیا(IGLS )
—استاندارد عام بین المللی توصیف آرشیوی(G-ISAD)
—استاندارد رمزگذاری و انتقال ابرداده(METS)
—استاندارد توصیف ابرداده ای شئی گرا(MODS)
—
—دوبلین کور
—این طرح نتیجه یک کارگاه آموزشی ست که در سال 1995 در شهر دوبلین ایالت اوهایو امریکا برگزار شد. گروههایی از کتابداران, متخصصان رایانه, متخصصان آرشیو و فراهم کنندگان خدمات پیوسته در این کارگاه آموزشی شرکت کردند و نهایتا 13 عنصر ابرداده ای را برای توصیف منابع شبکه وب تعیین کردند. در چهار کارگاه آموزشی بعد تعداد این عناصر به 15 افزایش یافت و از نظر دامنه نیز در مشارکتی در سطحی بین المللی قرار گرفت. دوبلین کور یکی از پراستفاده ترین استانداردهای ابرداده ای به شمار میاید. عملکرد این استاندارد از حوزه کتابشناختی شروع شد اما به یک استاندارد واقعی برای ابرداده در محیط های وب تبدیل شده است.
—
—پانزده عنصر ابرداده ای دوبلین کور به زبانهای بسیاری ترجمه شده اند که این عناصر در زبان فارسی توسط علی اصغر شیری ترجمه شده اند. این عناصر عبارتنداز:
.1عنوان(title): نامی که منبع داده می شود.
.2پدیدآور(creator): موجودیتی که مسئول به وجود آوردن محتوای منبع است.
.3موضوع(subject): موضوع محتوای منبع
.4توصیف(description): گزارشی از محتوای منبع
.5ناشر(publisher): موجودیتی که مسئول دسترس پذیری منبع است.
.6همکار(contributer): موجودیتی که در تهیه محتوای منبع همکاری و مشارکت داشته باشد.
—www.dublincore.org

7-تاریخ(date): تاریخی که به آفرینش یا در دسترس قرارگیری منبع مربوط است.

8-نوع(type): ماهیت یا گونه محتوایی منبع

9-قالب(format): شکل دیجیتالی یا فیزیکی منبع .

10-شناسه(identifier): ارجاعی روشن و واضح به منبع در بستر و بافتی مشخص

11-منبع(source): ارجاع به منبعی که منبع فعلی از آن مشتق شده است.

12-زبان(language): زبان محتوای فکری منبع

13-رابطه(relation): ارجاع به منبعی مرتبط

14-پوشش(coverage): وسعت و دامنه محتوای منبع

15-حقوق(rights management): اطلاعات مربوط به حقوق منبع

—مثالی از یک رکورد دوبلین کور از یک شعر کوتاه
—<HTML> !4.0!
<HEAD>
<TITLE>Song of the Open Road</TITLE>
<META NAME="
DC.Title" CONTENT="Song of the Open Road">
<META NAME="
DC.Creator" CONTENT="Nash, Ogden">
<META NAME="
DC.Type" CONTENT="text">
<META NAME="
DC.Date" CONTENT="1939">
<META NAME="
DC.Format" CONTENT="text/html">
<META NAME="
DC.Identifier" CONTENT="http://www.poetry.com/nash/open.html">
</HEAD>
<BODY><PRE>
I think that I shall never see
A billboard lovely as a tree.
Indeed, unless the billboards fall
I'll never see a tree at all.
</PRE></BODY>
</HTML>
—ویژگیها و مزایای دوبلین کور
—کاربردی بودن و انعطاف پذیری
—ویژگی مهم عناصر دوبلین کور قابلیت بیان آنها در زبانهای رایج نشانه گذاری(RDF,XML,HTML) است.
—این عناصر به راحتی توسط طیف گسترده ای از مشتریان وب بدون نیاز به آموزش درک می شود.
—تمامی عناصر انتخابی هستند و به هر سایتی اجازه میدهد که خود گزینه های اجباری و اختیاری خویش را تعریف کند.
—تمام عناصر قابل تکرار هستند.
—بر اساس نیاز گروههای خاص قابل گسترش می باشد به این معنی که می توان گزینه هایی بدان افزود.
—
—استاندارد ابرداده ای دولت الکترونیکی
—اطلاعات دولتی یکی از کانون هایی ست که گسترش هایی را برای دوبلین کور به منظور ایجاد پروفایل های کاربردی برای دولت الکترونیکی ضروری ساخته است. فعالیت دولتها در اینترنت از اواسط 1990 به این امر منتهی شد که ابرداده برای تسهیل اکتشاف منبع مورد نیاز است تا یافتن اطلاعات را در سایتهای وب دولتی برای عموم آسانتر سازد.
—واحد فناوری اطلاعات اداری کابینه انگلستان که بعدا“ اداره دولت الکترونیکی“ شد یک گروه کاری ابرداده تشکیل داد که به استاندارد ابرداده ای دولت الکترونیکی بر مبنای دوبلین کور منتهی شد. این استاندارد در آخرین ویرایش خود در سال 2006 دارای 25 عنصر ابردادهای است که عبارتند از: 
—عناصر ابرداده ای افزون بر عناصر دوبلین کور
.1Accessibility
.2Addressee
.3Aggregation
.4 Audience
.5Disposal
.6Mandate
.7Preservation
.8Digital signature
.9  Status
—خدمت مکان یاب دولتی اطلاعات
—دولت ایالات متحده خدمت مکان یاب دولتی اطلاعات(GLIS) را به منظور کمک به مردم برای یافتن اطلاعات از طریق نمایندگیهای مختلف فدرال تدوین کرده است. این یک خدمت غیرمتمرکز بر مبنای چندین سایت دولت فدرال مشتمل بر رکوردهای تقریبا 32 نمایندگی فدرال مختلف می باشد. این استاندارد شامل29 عنصر می باشد که برخی از آنها بنا بر ضرورت دارای زیر عنصرها یی نیز می باشند.
—خدمت مکان یاب دولتی استرالیا(IGLS)
—یک استاندارد ابردادهای برای اطلاعات دولتی بر روی اینترنت و بر اساس دوبلین کور می باشد. این استاندارد تمامی 15 عنصر دوبلین کور به علاوه 4 عنصر مخاطب, دستیابی, عملکرد و دستور کار را به کار گرفته است.
—استاندارد عام بین المللی توصیف آرشیوی       (G-ISAD)
—این استاندارد توسط شورای بین المللی آرشیوها تدوین شده و برای توصیف مجموعه های آرشیوی کاربرد دارد و دارای 26 عنصر داده ای است . این استاندارد بیشتر به منظور بکارگیری در کنار استانداردهای ملی یا به عنوان زیربنای برای تدوین استانداردهای ملی برای آرشیوها طراحی شده است. بعنوان مثال استاندارد ”توصیف کدگذاری آرشیوی“((EAD  که توسط کتابخانه کنگره اعمال شده و همان نقشی را برای آرشیوها دارد که مارک برای رکوردهای کتابشناختی.این استاندارد معبرهایی هم به و هم از استاندارد عام بین المللی (G-ISAD) دارد.
—منابع و مآخذ
—ابرداده ها و کاربرد آن در ذخیره, سازماندهی و بازیابی اطلاعات.WWW.nlai.ir/files/pdf/publication/metadata.pdf
—صفری, مهدی.“ابرداده و کاربرد آن در سازماندهی منابع وب با تاکید بر عناصر ابرداده ای دوبلین کور در بستر نحویHTML“ . فصلنامه کتاب, دوره چهاردهم, 3(پاییز1382): 73-85.
—ثورنلی, جنی.“ چگونگی ابرداده: ایجاد و استانداردها“. ترجمه محسن حاجی زین العابدینی. فصلنامه کتاب. دوره سیزدهم, 3(پاییز1381):ص134-
—”درک ابرداده و استانداردهای آن“. ترجمه و تالیف مریم اسدی.مجله الکترونیکی پژوهشگاه اطلاعات و مدارک علمی ایران, دوره ششم, 2(1385).

—
—
+ گروه کتابداری ارشد ; ۱٠:۳٥ ‎ق.ظ ; ٢٢ آذر ۱۳۸٩
comment نظرات ()