XML  : هل تغير مستقبل المكتبات الرقمية

هبة عبد الستار مصيلحى
تمهيدي ماجستير - تخصص معلومات - جامعة القاهرة
heba@cybrarians.info

 
النقاط الرئيسية
النشأة والتطور
المعايير والتطبيقات
تصميم مواقع المكتبات على الانترنت
النشر الإلكترونى
بناء وادارة قواعد البيانات البيليوجرافية
الفهرسة وصياغة وتبادل توصيفات البيانات
تبادل البيانات إلكترونياًEDI
Z39.50 المشكلة و ZeeRex الحل
XML ومستقبل المكتبات الرقمية
قائمة الاستهلاليات
الهوامش

مستخلص
تتناول الدراسة تطبيقات لغة التحديد القابلة للامتداد eXtensible Mark up  Language  XML فى المكتبات الرقمية حيث تبدأ بمقدمة عن تاريخ  و تطور لغات التحديد ونشأة لغة التحديد القابلة للامتداد XML وخصائصها والمعايير  والأدوات المرتبطة بها  ثم تتناول تطبيقاتها فى مجال المكتبات من خلال تصميم مواقع المكتبات على الانترنت ، والنشر الالكترونى و بعض المعايير المرتبطة به ، وإدارة قواعد البيانات الببليوجرافية مع عرض تجارب عملية فى هذا المجال ثم تطبيقاتها فى مجال صياغة وتبادل توصيفات البيانات Metadata من خلال معيار ONIX ومعيار دبلن كور Dublin core وتقنينات المقابلة بين معايير توصيفات البيانات المختلفة ، وكذلك فى مجال الفهرسة  مع التركيز على معيار MARC/XML من حيث خصائصه ونشأته وبناءه ثم تتناول علاقتها وامكانات الافادة منها فى مجال تبادل البيانات إلكترونيا EDI وكذلك مجال استرجاع المعلومات من خلال بروتوكول Z39.50 والجيل الثانى منه ZeeRex وأخيرا تتناول بشكل سريع تأثير لغة التحديد القابلة للامتداد على المكتبات الرقمية وإمكانيات الافادة منها فى المكتبات المصرية.

 

 

الاستشهاد المرجعي بالبحث

هبة عبد الستار مصيلحي . XML :هل تغير مستقبل المكتبات الرقمية . - cybrarians journal . - ع 1 (يونيو 2004) . - تاريخ الاتاحة < اكتب هنا تاريخ اطلاعك على الصفحة > . - متاح في : www.cybrarians.info/journal/no1/xml.htm

 

 

 

 

النشأة والتطور

  تنتمى لغة التحديد القابلة للامتداد(XML)  eXtensible Mark up Language  الى عائلة لغات التحديد Mark up Languages والتى يمكن تعريفها بأنها لغات لهيكلة النصوص وترميزها بشكل يسهل التعامل معها ومعالجتها آليا وهى لغات ترميز اكثر منها كلغات برمجة بالمعنى المفهوم والمتعارف عليه لكلمة برمجة . حيث نجد قاموس علم المكتبات والمعلومات المتاح على الخط المباشر ODLIS يعرفها كالأتى:

"مجموعة محددة مسبقا من الواصفات سواء كانت (رموز و تيجان ) او طريقة لتعيين وتحديد تلك الواصفات والتى تستخدم فى ادماج وتضمين ايه معلومات خارجية داخل وثيقة نصية إلكترونية و عادة ما تشير الى تحديد شكل تلك المعلومات او لتيسير إجراءات التحليل التى تتم عليها . ولقد صممت لغات التحديد لتعمل مع برامج محددة الا انه قد تم اعتماد لغة التحديد المعيارية العامة SGML  كمعيار عالمى فى عام 1986 وبعد ذلك خرجت منها لغة تحديد النص الفائق التى تستخدم فى انشاء صفحات الانترنت . وفى عام 1998 قامت رابطة الشبكة العنكبوتية بالتوصية باستخدام النموذج المصغر من لغة التحديد المعيارية العامة SGML  والذى عرف فيما بعد بلغة التحديد القابلة للامتداد XML . وتختلف معظم لغات التحديد عن قواعد البيانات فى قدرتها على تحديد العناصر المتضمنة داخل النص دون تمييز عناصر البيانات المهيكلة الا ان لغة التحديد القابلة للامتداد لديها القدرة على تحويل اى نص الى قاعدة بيانات متكافئة  "

 ويتضح من التعريف السابق بأن مهمة لغات التحديد تتركز فى ترميز المعلومات وصياغتها فى بناء هيكلى موحد يسهل التعامل معه بواسطة كافة الانظمة والتطبيقات فهى تعنى وتركز على شكل المعلومات وتحديد الاجراءات التى ستتم عليها

واذا نظرنا الى تاريخ لغات التحديد (1) نجد ان البداية كانت فى سبتمبر 1967 خلال اجتماع فى مكتب النشر الكندى الحكومى حيث قام  William Tunnicliffe بإلقاء عرض لفكرة جديدة تدور حول فصل محتوى المعلومات عن الشكل الخاص بها  وتوافق هذا مع كتابات اخرى فى هذا المجال وبدأ الاتجاه الى فصل الشكل عن المحتوى .

وفى عام 1969 ظهر مشروع GenCode الذى عمل فيه تشارلز جولدفارب الذى كان تحت رعاية شركة IBM ونتج عنه لغة التحديد العامة Generalized Markup Language (GML) وبعد عدة سنوات ومع المزيد من العمل برزت الى النور لغة التحديد المعيارية العامة Standard Generalized Markup   Language  SGML  وبالطبع جاءت لتتغلب على نواحى القصورالتى كانت موجودة فى  لغة التحديد العامة من خلال امكانية معالجة الروابط والجمع بين اكثر من نوع للمعلومات معا ومع حلول الثمانينات من القرن الماضى كانت لغة التحديد المعيارية العامة قد انتشرت فى اغلب الشركات والمؤسسات الحكومية فى العالم . وكانت من أوائل اللغات الخاصة بترميز النصوص الفائقة وهيكلتها لغة التحديد المعيارية العامة والتى تم اعتمادها من الايزو عام 1986 واصدرت بشأنها معيار ISO 8879. هذا و لم تنتشر فى بداياتها بين المستخدمين لصعوبتها وتعقدها حيث انها صممت اساساً لتطوير ونشر الوسائط المتعددة وذلك لدعمها لتكامل البيانات المختلفة وتمثيلها بشكل يسهل من التعامل معه لذا هى مفيدة جدا فى إنشاء الصفحات المعقدة والمركبة التى تجمع بين أكثر من نوع وشكل لمصادر المعلومات .

ومن اجل هذا برزت الحاجة الى لغة اسهل وابسط خاصة لخدمة المستخدمين غير المتخصصين والذين يريدون إنشاء صفحات بسيطة لهم فكان ظهور HTML أو لغة تحديد النص الفائق والتى انتشرت بسرعة الصاروخ لسهولة التعامل معها من خلال العديد من البرامج وأدوات تحرير النصوص مثل Microsoft Word  حيث كانت تعتمد على التيجان Tags  لهيكلة النص فى شكل فقرات وقوائم وروابط فائقة . 

 

ولقد ظهرت هذه اللغات كى تتعامل مع ما يسمى بالنص الفائق او التشعبى Hyper Text الذى اصبح الاسلوب المميز لنوع النصوص المنشورة على الانترنت حيث يتم الاعتماد فيه على الربط بين اكثر من عنصر او كائن داخل الوثيقة مع سهولة الانتقال بين هذه العناصر سواء عن طريق الربط الصاعد او الهابط .

      ولقد انتشرت هذه الطريقة فى صياغة النصوص ونشرها مع ظهور الانترنت وتطبيقاتها وبصفة خاصة الشبكة العنكبوتية عندما قام تيم بيرنز لى أحد مديري مؤسسة رابطة الوب او الشبكة العنكبوتية W3C  بابتكار اول بروتوكول للنص الفائق يعمل على الانترنت ولهذا يعزى اليه اختراع الوب .

 

      إلا ان فكرة النص الفائق والربط بين النصوص وغيرها من الوسائط او مصادر المعلومات فى اطار واحد تمتد جذورها الى الأربعينات من القرن الماضى وتحديدا الى يوليو عام 1945 عندما أطلق فانيفار بوش الذى كان يعمل وقتها مديرا للمكتب الأمريكى للبحث العلمى والتطوير مقالته الشهيرة "As We May Think" التى وصف فيها تخيلاته ورؤيته للنص الفائق والذى اطلق عليه وقتها اسم "MEMEX" حيث اقترح الربط بين المعلومات مع امكانية وسهولة تعديل واضافة معلومات اخرى خاصة بالمستخدم ولقد تجسدت تلك الأفكار وأصبحت حقيقة مع ظهورالشبكة العنكبوتية التى اصبحت تعتمد بشكل اساسى على بروتوكول النص الفائق HTTP  .إلا أنه مع هذا الانتشار الذى وجدته لغة   HTMLوالتطوير  المستمر الذى كانت تخضع له حتى ظهور أخر اصدار لها HTML 4.0 فى عام 1997  فلقد وجد انها تمثل عقبة فى نشر الوسائط المتعددة فهى تعمل بكفاءة شديدة مع المواد النصية ولكن هناك حاجة ماسة للتعامل مع كافة انواع الوسائط لذا تم تطويرها وإصدار Dynamic HTML او DHTML لتصبح أكثر ديناميكية فى التعامل مع الوسائط المتعددة ونشرها على الانترنت .

      ولقد كانت لغات التحديد السابقة تعتمد على المحددات التى كانت تسهل على الحاسب الآلى التعامل مع النصوص داخل تيجان التحديد سواء بالعرض على الشاشة او الطباعة والتعديل إلا ان هذه المحددات او التيجان لا تصف الوثيقة نفسها بكفاءة فلا يمكن مثلا ان يتم تقديم توصيف لكلمة ما فى الوثيقة أو إضافة معناها او ما تدل عليه وكانت هذه المشكلة تبرز أكثر عند استرجاع الوثائق حيث أرجع الكثيرون فشل محركات  البحث فى تقديم نتائج جيدة إلى شكل وطريقة هيكلة الوثائق لذا ظهرت XML لتحل هذه المشكلة حيث يمكن من خلالها إضافة توصيف لأى فقرة او كلمة داخل الوثيقة ومن ثم يتحول معها اى مستند الى قاعدة بيانات ضخمة يمكن البحث فيها ومشاركتها مع التطبيقات المختلفة(2) أضف الى ذلك ايضا انها جاءت كنقطة إلتقاء بين لغتى SGML  و HTML فهى تسهل من تبادل البيانات بين المصادر التى تمت كتابتها باللغتين السابقتين فهى كما يشير قاموس علم المكتبات والمعلومات المتاح على الخط المباشر :

"  مجموعة فرعية من لغة التحديد المعيارية العامة حيث تقوم التيجان بتحديد نوع المعلومات المتضمنه فى عناصر البيانات ( على سبيل المثال : رقم المنتج ، السعر ، ...الخ) وليس مجرد الاكتفاء بتحديد طريقة عرضها وكلمة Extensible  او القابلة للامتداد تعنى وتشير الى عدم محدودية تلك التيجان وعدم التقيد فى صياغتها حيث لا يشترط التعريف والتحديد المسبق لها كما هو الحال فى لغة تحديد النص الفائق HTML . حيث يجب انشائها وتحديدها خلال تحليل الوثيقة  من قبل منتج او منشىء  الوثيقة . ولقد صممت لتفى باحتياجات النشر الالكترونى ، وهى شكل نصى مرن يمكن استخدامه مع لغة تحديد النص الفائق فى نفس الصفحة و تتم هيكلة الوثيقة من خلال وثيقة تعريف النوع او كود اللغة نفسه حيث يمكنها التعامل مع الوثائق الهرمية "

 والمسئول عن تطويرها ايضا هى نفس الجهة المسئوله عن اللغات السابقة  وهى مؤسسة رابطة الشبكة العنكبوتية W3C وهى عبارة عن مؤسسة مكونة من أكثر من 180 عضواً من منظمات وهيئات تجارية واكاديمية وحكومية من مختلف أنحاء العالم ينصب نشاطها على تطوير البروتوكولات والمعايير المستخدمة على الشبكة العنكبوتية وقد قامت باطلاق XML فى 1996 وتم اعتمادها نهائياً من قبل الرابطة فى فبراير 1998 الذى كان عام انتشارها على الانترنت .

      وكما يشير موقع الرابطة فقد روعى عند تصميم هذه اللغة أن يتم تحقيق عدة أهداف هى :
  - تقنين نشر المصادر الالكترونية بشكل مستقل بأسلوب موحد .
 
- سهولة تبادل البيانات خاصة المرتبطة بالتجارة الالكترونية .
  -
تسليم المعلومات الى البرامج المحلية المستخدمة من قبل المستفيدين بشكل يسهل من معالجتها آلياً والتعامل معها فور استقبالها واستلامها .
  - سهولة معالجة المعلومات والبيانات وتبادلها عبر مختلف التطبيقات والأنظمة بتكلفة أقل.

سهولة نشر ودعم صياغة توصيفات البيانات Metadata لكل وثيقة مما يسهل استرجاعها واكتشافها ومن ثم ايجاد حلقة اتصال بين منتج او صانع المعلومات والمستفيد النهائى منها.

هذا وتعتبرXML  الابن الثانى للغة SGML حيث تعمل كنسخة مصغرة من الأخيرة ولقد أصدرت رابطة الشبكة العنكبوتية اصدارا مصغراً ل XML  أطلقت عليها X-Smiles 0.6 و تم اطلاق الاصدار السادس منها فى ابريل 2002 هى خاصة بالمستخدمين المبتدئين حيث تشتمل على أقل عدد ممكن من التيجان وأكثر الامكانات انتشاراً واستخداماً . وعلى عكس سابقتها HTML التى كانت تواجه مشكلات عديدة فيما يتعلق بعدم الإحكام والسيطرة الكافية للتعبير عن البيانات حيث لا تهتم بترتيب  الأكواد الخاصة بالبيانات مما يصعب الأمر بالنسبة لبرنامج المتصفح فى استنتاج المعنى المقصود من البيانات وهيكلتها وترتيبها بالشكل المقصود الأمر الذى  يجعل من احتمالية تعدد الترجمة وتفسير البيانات من خلال أكثر من متصفح احتمالا قائما بشدة خاصة مع الصفحات المعقدة التى تشتمل على اكثر من شكل للمعلومات  جاءت  XML لتقضى على هذه المشكلة فهى تهتم بماهية البيانات والهدف منها ولا تترك للبرنامج او المستخدم ان يخمن او يشكل البيانات فهى لغة مقيدة ومحكمة تقوم بذلك بنفسها وتهتم بأدق التفاصيل حيث تتم معالجة البيانات داخلها من خلال برامج XML وتطبيقاتها .

المعايير والتطبيقات

      هناك العديد من المعايير التى تتعلق بلغة XML  اشهرها معيار ISO 150022 ولقد اصدرت المنظمة الدولية للتوحيد والقياس ISO  عدة معايير تهتم بتطبيقات XML المختلفة لعل أهمها :

§   ISO/IEC 8825-4:2002
وهو معيار يهتم بوضع قواعد للتكويد باستخدام XML.

§  ISO/IEC 9075-14:2003
معيار يتعلق بضوابط استخدام لغة الاستعلام المهيكلة SQL ولغة XML فى تطبيقات قواعد البيانات .

§   ISO/TS 10303-28:2003
وهو معيار تطورة اللجنة الخاصة بتطبيقات النظم الآلية فى مجالات الصناعة وهو يتعلق بتمثيل وتبادل البيانات الخاصة بلغة XML.

§    ISO/IEC 13522-8:2001
معيار تكويد النصوص والوسائط الفائقة باستخدام لغة XML

§     ISO/IEC TR 18057:2004
معيار يستخدم فى نظم الاتصالات اللاسلكية وتبادل المعلومات بين النظم المختلفة التى تستخدم  تقنية التصفح الصوتى Voice Browsering  .

§    ISO/TS 20625:2002
معيار يدعم تبادل البيانات الكترونيا EDI ويركز على قواعد تخليق وصياغة وتبادل  الملفات بلغة XML  وقامت بتطويره اللجنة الخاصة بتبادل البيانات الكترونيا لاغراض الادارة والتجارة والنقل EDIFACT .

§    ISO/IEC TR 22250-1:2002
معيار يركزعلى التوصيف اللغوى القياسى للغة Regular Language Description for XML RELAX

§    ISO 22643:2003
معيار يركز على قاموس كيانات البيانات المحددة مسبقا والتى يتم توصيفها من خلال تقنية DTD التى تهتم بتوصيف البيانات .

 

هذا وبعيدا عن معايير الايزو هناك اكثر من 400 مبادرة (3)  تجمع بين معايير وتطبيقات  وتقنيات خاصة بلغة XML فى مختلف المجالات، ولغة XML مثلها مثل اى لغة اخرى تستند على مجموعة من الأدوات : 

XSL - eXtensible Style Landuage)  ) لغة تحديد الأنماط القابلة للامتداد (4) وهى لغة خاصة بتنسيق البيانات بأكثر من شكل وطريقة لتتلائم واحتياجات المستفيدين المختلفة.

(XML Linking Language) X Link   لغة تخليق الروابط الفائقة (5) وهى مسئولة عن تخليق الروابط الفائقة وتضمينها داخل الوثيقة بعد تعريفها من خلال لغة التأشير Pointer X .

(XML Pointer Language) X Pointer لغة التأشير (6) وهى تشير الى مكان المصدر او الكائن داخل الوثيقة وكذلك العناصر الأخرى المرتبطة به حيث تعمل كمحدد او معرف معيارى لأى مصدر Uniform Resource Identifier وهى تستند على لغة تحديد المسارXML Path language - X Path.

(XML Path language) X Path لغة تحديد المسار الخاصة (7) وهى تهتم  بتحديد مسار او مكان المصدر داخل الوثيقةحيث تعمل بمثابة محدد معيارى لعناوين المصادر Uniform Resource Locator.

وكلا اللغتين مسئول عن توصيف البيانات داخل الوثيقة وتحديدها بالتيجان المناسبة وتحديد مسارها والهدف منها وعمليات المعالجة التى ستتم عليها من خلال تقنية وثيقة  تعريف النوع (DTD) Document Type Definition التى يتم من خلالها تحديد موصفات كل عنصر أو مصدر داخل الوثيقة وتوصيفه وتحديد الطريقة التى يتم بها ترتيب تلك العناصر والإجراءات أو المهام التى ستتم على تلك العناصر وأى التطبيقات سيقوم بتلك الاجراءات فهى بمثابة تعليمات وتوجيهات من اجل تيسير تبادل البيانات أو  التعامل معها من قبل الأنظمة والتطبيقات المختلفة . وتلك المعايير تخضع حالياً للتطوير من قبل W3C .

 (XML Query Language) X Query لغة الاستعلام الخاصة بالبحث واسترجاع المعلومات الخاصة بأى عنصر بيانات او مصدر داخل الوثيقة (8) حيث تستند فى عملها على لغة تحديد المسار X Path  ولغة التأشير X Pointer  .

 والأمر لم يقف عند هذا الحد بل سعت W3C إلى الدفع بين XML و HTML ليعملا معاً فى حاوية أو لغة واحدة .. فأطلقت لغة تحديد النص الفائق القابلة للامتداد (Extensible Hypertext Markup Language) XHTML. لأول مرة فى يناير 2002 والتى أطلق عليها البعض اسم HTML 5.0 .إلا انها أكثر من مجرد إصدار آخر من HTML . ففى أكتوبر 2001 تم إطلاق الإصدار الثانى منها وهدف إلى إعادة تشكيل وتكوين تيجان HTML لتتكامل مع تطبيقات XML حيث ستكون حجر الأساس فى تطوير المعايير التى تدعم نشر والتعامل مع صفحات الانترنت من خلال مختلف برامج المتصفحات Browsers حتى تلك التى تعمل من خلال التليفونات المحمولة والتليفزيونات التفاعلية ونظم الاتصالات اللاسلكية بصفة عامة مما يؤدى إلى تقليل تكاليف كتابة وتخليق النصوص الفائقة مع سهولة أكثر فى التعامل مع قواعد البيانات والتطبيقات المختلفة فضلا عن تكامل HTML مع مختلف تطبيقات XML كما سبق وأشرنا

تطبيقات لغات التحديد فى المكتبات

1 - تصميم مواقع المكتبات على الانترنت

لا شك أن أغلب المكتبات قد استخدمت لغة HTML فى تصميم مواقعها على الإنترنت ولكن يجب على المسئولين عن هذه المواقع النظر للمستقبل خاصة مع ملاحظة السرعة التى تنتشر بها XML  وعزوف الكثير من مصمى المواقع عن استخدام  HTMLمع وجود العديد من اللغات الاخرى حتى ان البعض يشير الى موت  HTML (9) لذا يفضل أن يتم استخدام XHTML بالنسبة لحفظ المصادر الرقمية على المدى البعيد مع استخدام تقنية وثيقة تعريف النوع (DTD) Document Type Definition.

كذلك عند تصميم بوابات “Portals” داخل مواقع المكتبات للربط بينها وبين المكتبات وشبكات المعلومات الأخرى تكون هناك مشكلة فى تبادل البيانات الموزعة والمنتشرة بين أكثر من شبكة معلومات موزعة جغرافيا .

من هنا تلعب XML دوراً هاماً فى تقديم توصيفات البيانات Metadata  وغيرها من البيانات بشكل معيارى يسهل تبادله والتعامل معه آلياً من خلال تقنية DTD .

أيضاً تستخدم لغة XML فى تبادل البيانات بين مختلف التطبيقات داخل الشبكات الداخلية للمكتبات  Libraries Intranet (10) حيث تسمح بتأمين وإدارة البيانات بمستويات مختلفة داخل تلك الشبكات .

2 - النشر الإلكترونى

استخدمت XML كلغة لنشر الكتب الإلكترونية نفسها من جهة وفى تبادل البيانات بين ناشرى هذه الكتب من جهة أخرى (11) ولقد ساعد هذا ظهور العديد من المعايير التى تنظم هذا الأمر .. مثل :

§  معيار تبادل الكتب الإلكترونية Electronic Book Exchange - EBX

وهو معيار بنى أساسا على لغة XML بهدف تسهيل النشر وتبادل الكتب الالكترونية بين الناشرين والمكتبات والعاملين فى صناعة الكتب الالكترونية بصفة عامة مثل الموزعين والوسطاء .

§   معيار البناء المفتوح لنشر الكتب الإلكترونية The Open E. Book Publication Structure (OEB)

وهو نموذج بيانات لهيكلة نصوص الكتب الإلكترونية ونشرها وتم اطلاقه فى سبتمبر1999 وهو يسمح بقراءتها على مختلف الاجهزة والتطبيقات .

أيضاً قامت شركة Gale Group .. وهى شركة عالمية رائدة فى مجال النشر الإلكترونى ونشر المراجع الإلكترونية لصالح المكتبات والمؤسسات التعليمية . أعلنت مؤخراً عن تطويرها لأداة تسمى ناشر XML المحترف (XPP) XML Professional Publisher تستخدم هذه الاداة  فى نشر المواد المرجعية وغيرها بلغة XML و SGML وترجمتها إلى شكل آخر متداول عبر الانترنت مثل PDF وهذه الاداة يمكنها حتى الآن التعامل مع الصفحات ذات التصميم البسيط أما الصفحات المعقدة التى تشتمل على اكثر من نوع مثل الصوت والصورة والنص فلا تجيد التعامل معها فهى تخضع للتطوير الآن ولكنها تتميز بسهولة الاستخدام حيث لا يشترط ان يكون المستخدم على دراية بلغتى XML أو SGML .

3 - بناء وادارة قواعد البيانات البيليوجرافية

لعل أبرز مثال يمكن أن نسوقه هنا هو نموذج المكتبة القومية الطبية الأمريكية NLM فلقد اعتمدت المكتبة (12) فى بناء النظام الخاص بها على لغة XML لتمثيل البيانات وترميز الاستشهادات البليوجرافية المتضمنة فى مرصد بيانات Medline .. وهى تعمل الآن على نقل وترجمة اكثر من 12 مليون تسجيلة ببليوجرافية إلى شكل XML وذلك ليسهل التحكم فى هذه البيانات وادارتها واخراجها فى أكثر من شكل وطريقة لخدمة احتياجات المستفيدين المختلفة كذلك تعمل على اخراج قائمة رؤوس الموضوعات الطبية الخاصة بها MESH فى شكل XML وستطرحها فى الأسواق قريبا من خلال تبنيها لمعيار MARC/XML الذى سيرد الحديث عنه تفصيلا لاحقا ايضا تعتمد على لغة XML فى بنية محرك البحث الخاص بها.

هذا وليست المكتبة القومية الطبية الأمريكية  هى التجربة الوحيدة فى هذا المجال بل هناك ايضا مشروع مكتبة لان الطبية بالمركز الطبى لجامعة ستانفورد والمعروف باسم Medlane project والذى بدأ منذ 1998 حيث يتم من خلاله تحويل تسجيلات مارك الى شكل XML والذى نتج عنه مشروع XOBIS (the XML Organic Bibliography Information Schema) .

كذلك نجد رابطة مكتبات واشنطن للبحث The Washington Research Library Consortium حيث تستخدم XML لاتاحة قواعد البيانات والمجموعات الرقمية والمواد المعارة وكذلك بيانات الفهرس الخاص بها من خلال نظام محلى تم تطويره بواسطة المكتبة وهو يسمى ALADIN (Access to Library And Database Information Network)  والبرنامج لايقتصر فى خدمته على مكتبات البحث الاكاديمية فقط بل يتعدى ذلك الى القيام بمهام اخرى معقدة مثل قابلية التحقق من هوية المستفيد من خلال تحويل رسائل XML عبر تطبيقات شبكة المكتبات على الانترنت (13) .

 أيضاً يمكن استخدام لغة XML وأدواتها فى إنتاج الببليوجرافيات(14) حيث يمكن تحويل البيانات البببليوجرافيةXML لمرة واحدة ثم يعاد استخدامها لاكثر من مرة بأكثر من طريقة وشكل فى أكثر صفحة لأكثر من هدف .. فمثلاً يمكن عمل الببليوجرافية مرة بالمؤلف ثم تحويلها إلى ببلوجرافية بالعنوان أو الموضوع أو بالفترة الزمنية أو حتى بالسلاسل أو الناشر فكل هذا متاح من خلال ما تقدمه XML من أدوات خاصة : XSL لغة تحديد الأنماط القابلة للامتداد التى تسمح بعرض المعلومات بأكثر من طريقة اعتمادا على احتياجات المستفيدين منها وكذلك لغة X Link التى تسمح بعمل قائمة ببليوجرافية بمواقع الانترنت المتخصصة موضوعيا فى موضوع قد يهم المستفيدين .. ومن خلال هذه الأدوات سيمكن صيانة وتحديث قائمة ببليوجرافية واحدة ثم عرضها وترتيبها بأشكال مختلفة آليا وفق احتياجات المستفيدين

4 - الفهرسة وصياغة وتبادل توصيفات البيانات Metadata

( أ ) صياغة وتبادل توصيفات البيانات Metadata

استخدمت تقنيات ومعايير توصيفات البيانات لغة XML .. مثل :

·        معيار تبادل المعلومات علىالخط المباشر (15) ONIX)Online Information  eXchange

 وهو معيار جاء نتيجة جهد قطاع النشر وصناعة الكتب وصمم أساسا بهدف تسهيل تبادل البيانات الكترونيا بين دور النشر المختلفة والمهتمين بصناعة الكتاب والمستفيدين وتدعيم زيادة مبيعات الكتب من خلال إمداد المستفيدين ببيانات كاملة و متكاملة فى محتواها عن كل وعاء قد يتقدم بطلب شراءه حيث يمد المستفيد ببيانات شاملة عن الكتاب وصلت الى 211 عنصر واستخدم هذا المعيار لغة XML فى ترميز هذه العناصر ولقد قامت مكتبة الكونجرس بعمل مقابلة بين هذا المعيار ومعيار MARC من خلال ONIX / MARC مما يسهل من تبادل البيانات الببليوجرافية الكترونياً بين المكتبة وغيرها من المكتبات وبين الناشرين . 

·        معيار دبلن كور

      هو تقنين عام لا يرتبط بمجال موضوعى معين أو نوع مخصص من الأوعية ويتكون من 15 عنصر Data Element  لتوصيف البيانات وهذه العناصر تتم صياغتها من خلال معيار RFC 2413  الذى يعد أول معيار متوافق مع Dublin Core  وعرف فيما بعد بـ DC 1.0 و RFC هو اختصار لــ  Request for Comments وقامت بتطويره IETF  ويتم التعبير عن هذه العناصر بكود HTML فى رأس الوعاء Header وبدأ يستخدم منذ 1996 وانتشر فى العديد من الدول المختلفة ولعل سبب انتشاره هو الحاجة الشديدة لمثل هذا المعيار وأهمية توصيفات البيانات مما جعله المرشح الأقوى لتحقيق الأهداف المتعلقة بفهرسة وتوصيف مصادر المعلومات الالكترونية فضلاً عن المميزات الأخرى التى يتمتع بها مثل المرونة والاعتمادية وسهولة هذه الواصفات بحيث يسهل فهمها وتطبيقها من قبل قطاع عريض من المستفيدين و المستخدمين ومنتجو مصادر المعلومات دون الحاجة للتدريب عليها .كذلك يكفل تأمين وإدارة الحقوق المتعلقة بالملكية الفكرية . ويعد كذلك نموذج مستقل يمكن دمجه داخل قطاع عريض من البرمجيات والتطبيقات .

      ويمكنه وصف المصدر بدقة وكذلك المصادر الملحقة به أو المرتبطة به .أضف إلى هذا ترجمته إلى أكثر من 25 لغة منها : العربية – الصينية- الألمانية - التشيكية - الدانمركية - الإيطالية - اليابانية - الأسبانية - الفرنسية - اليونانية - الفنلندية - البرتغالية والكورية وغيرها من اللغات الأخرى كل هذا دعى إلى دعمه عالمياً خاصة عندما أصدرت الأيزو ISO المعيار المتوافق معه والمعروف بمعيار ISO 11179 .

      كل هذه الأمور جعلت DC مرشحاً قوياً للتطبيق فى مجالات موضوعية مختلفة فضلاً عن اعتماد مشروع نظام الأرشيف المفتوح The Open Archives Initiative System (16) على تقنين DC وهو مشروع للمواد الأرشيفية يهتم كذلك بالمصادر التعليمية وتم إطلاقه فى أكتوبر 1999 بهدف تسهيل تبادل وتفسير وتدفق المواد الأرشيفية الإلكترونية بين مختلف الأنظمة من خلال بروتوكول OAP The Open Archives Protocol  باستخدام لغة  XMLترميز وتكويد عناصر البيانات. فعلى سبيل المثال يمكن التعبير عن توصيفات البيانات الخاصة بتلك المقالة من خلال تلك الشريحة التى تضم بعض عناصر تقنين دبلن كور DC كالتالى :

<?XML version=”1.0”?>

<dc XMLns=”http://www.cybrarians.info/journal”> 

   <title>XML: is it convert the future of digital libraries? /</title>

  <creator>Heba A.Sattar  </creator>

  <creator Email>hoba10@ahram0505.net</creator Email >

  <type >Article</type >

   <contributor> Cybrarians Journals,no.1</ contributor>

  <publisher>Cairo :Cybrarians Group</publisher>

  <date>2004.</date>

  <language>arb</language>

  <description>An  article about XML and it’s Features, applications and impact on digital libraries.</description>

  <subject>markup languages</subject>

  <subject>XML,SGML,HTML,XHTML.</subject>

  <subject>web applications,standards,</subject>

  <subject>web publishing,Ebooks,EDI,z39.50,zeeRex.</subject>

  <subject>Metadata,MARC,DC,ONIX,DTD,MODS.</subject>

   <format>microsoft word file</format>

 </dc>

ومع ظهور العديد من التقنيات والمعايير وظهور الحاجة الى تبادل البيانات بين هذه المعايير والقضاء على مشكلات تفسير البيانات ظهرت أطر ونماذج لهيكلة البيانات تسمح بالمقابلة او الترجمة  بين اكثر من معيار فى نموذج واحد من خلال تقنية سمات التطبيق Aplication Profiles  (17،18) التى يتم من خلالها صياغة نموذج بيانات حيث  يتم ترجمة المعيار المحدد  إلى معين او محدد الاسماء namespace  الخاص بهذا النموذج ثم التعبير عنه بلغة ترميز مهيكلة مثل XML فهو أشبه بهيكل بيانات يتكون من عناصر بيانات من واحد أو أكثر من   محددات الاسماء namespaces  تتألف معاً من خلال التطبيق وتعمل بمثابة قاموس او محدد مستقل يحدد لكل عنصر تعريف غير قابل للتكرار حتى يسهل استرجاعه وإدارة توصيفات البيانات بالكامل والأمر نفسه بالنسبة لإطار وصف مصادر المعلومات RDF  حيث يسمح بإعادة استخدام الوصف الخاص بتوصيفات البيانات كأساس لوصف توصيفات بيانات أخرى مما يدعم المشاركة بين البيانات (19) وكلاهما يستخدم لغة XML فى ترميز وهيكلة بيانات النموذج مما يسمح بسهولة تبادل البيانات وتفسيرها بين مختلف معايير توصيفات البيانات .

لذا يمكننا القول بأن  XMLتقدم هيكلاً مفتوحاً لإستيعاب أنواع توصيفات البيانات المختلفة كذلك يسمح هذا  الهيكل أو البناء بتكامل البيانات المهيكلة مع غيرها من البيانات الغير مهيكلة ( نصوص - صور - بريد اكترونى  -  وسائط متعددة ).

(ب) الفهرسة

وسط عالم من الروابط الفائقة وقواعد بيانات النص الكامل كان التحدى الكبير أمام معيار مارك MARC .. فلقد ظهر قصور فى تعاملها مع المعلومات الهرمية والبحث فى وثائق النص الكامل بكفاءة فضلا عن عدم استطاعتها التعامل بسهولة مع الطبيعة الديناميكية للمصادر الإلكترونية من تعدد النسخ والاصدارات خاصة فى حالة الوسائط المتعددة لذا أطلقت مكتبة الكونجرس إصدارها من MARC / XML لأول مرة فى ديسمبر 1999  و أعلنت عنه نهائيًا فى فبراير 2000 والذى تم بناءه على أساس MARC / SGML الذى كان يخضع للتطوير منذ منتصف التسعينات من القرن الماضى حيث تم التعبير عن مفردات مارك بلغة XML لعمل فهارس مكتوبة بـ XML مما يكفل سهولة تبادل البيانات وارتفاع درجة استدعائها  High Recall والقضاء على مشكلة استراتيجية البحث التى تفشل فى اعطاء نتائج فى كثير من الأحيان  فضلا عن  محاولة إيجاد حل لمشكلة انخفاض معدل التحقيق Low Precision والتى قد ينتج عنها الكثيرمن النتائج الغير مرتبطة بموضوع البحث وتستند هذه المقابلة او الترجمة على تقنية وثيقة  تعريف النوع  ( MARC DTD (Document Type Definition      لكل من البيانات الببليوجرافية والمداخل وقوائم الاستناد مع اعطاء بيان تفصيلى عن كل عنصر بيانات .. فعلى سبيل المثال :

يمكن توصيف اسم المؤلف بأكثر من موصف دون المساس بالاسم نفسه او دون ان تكون هذه الموصفات جزءاً من الاسم وقد تكون هذه الموصفات بيانات ببليوجرافية وقد لا تكون بيانات ببليوجرافية مثل البريد الالكترونى للمؤلف و ذلك باستخدام  لغة X Links و لغة X Pointers تلك الأدوات تستند عليها XML فكما سبق واشرنا الى المرونة التى تتمتع بها تلك اللغة حيث تسمح للمستخدم بتخليق التيجان التى يرغب من خلالها  فى تمثيل البيانات الخاصة به وفق طبيعة تلك البيانات واحتياجات استرجاعها فعلى سبيل المثال يمكن عمل تسجيلة مبسطة يتم فيها صياغة التيجان وفق بيانات الفهرسة كالتالى :

<marc_record>
<book>
<title>XML for Web publishing in six easy steps</title>
<author>Pfaffenberger, Bryan</author>
<publisher>AP Professional</publisher>
<publication_year>1998</publication_year>
</book>
<subject_heading>Web publishing</subject heading>
</marc_record>

 

وفيما يلى مثال لتسجيلة ببليوجرافية كاملة لعناصر مارك فى شكل XML

 

<?XML version="1.0" encoding="UTF-8" ?>

<collection XMLns="http://www.loc.gov/MARC21/slim">

<record>

  <leader>01142cam 2200301 a 4500</leader>

  <controlfield tag="001">92005291</controlfield>

  <controlfield tag="003">DLC</controlfield>

  <controlfield tag="005">19930521155141.9</controlfield>

  <controlfield tag="008">920219s1993 caua j 000 0 eng</controlfield>

   <datafield tag="010" ind1="" ind2="">

  <subfield code="a">92005291</subfield>

  </datafield>

   <datafield tag="020" ind1="" ind2="">

  <subfield code="a">0152038655 :</subfield>

  <subfield code="c">$15.95</subfield>

  </datafield>

   <datafield tag="040" ind1="" ind2="">

  <subfield code="a">DLC</subfield>

  <subfield code="c">DLC</subfield>

  <subfield code="d">DLC