XML چيست و چرا دارای اهميت فراوان است ؟

( بخش اول )
تاکنون مقالات فراوانی در باره XML نوشته شده است، اغلب مطالب عنوان شده صرفا” بر روی يک موضوع خاص تمرکز داشته و از زاويه ای کاملا” اختصاصی و در عين حال محدود به بررسی تکنولوژی XML پرداخته و بندرت به موارد اساسی و خانواده بزرگ استاندارهای XML اشاره شده است. در اين مقاله عناصر کليدی مرتبط با تکنولوژی XML تشريح و ارتباط آنها تبين و جايگاه هر يک از آنها برای پياده کنندگان و طراحان برنامه های اطلاعاتی تشريح می گردد. پس از مطالعه اين مقاله ، خوانندگان با استانداردهای کليدی : XML,XSL,XML-Schema,DOM,SAX,Namespace,XLink بهمراه تکنولوژی های مربوطه آشنا خواهند شد.

تعريف اصطلاحات و واژه ها
در ابتدا لازم است با کلمات تشکيل دهنده XML يعنی Extensible ، Markup و Language آشنا شويم .Markup ، واژه ئی برای متاديتا است . متاديتا ، اطلاعاتی در رابطه با اطلاعات است . قدمت استفاده از Markup به قبل از کامپيوتر بر می گردد . مثلا” در دنيای نشر از علائم خاصی در متن های ويرايش شده استفاده تا به پردازنده متن ( انسان و يا ماشين ) اعلام شود ، چه نوع عملياتی را در رابطه با اطلاعات می بايست انجام دهد. HTML يکی از زبان های کلاسيک نشانه گذاری است . مثلا” با افزودن تگ <Bold> به مرورگر اعلام می شود که به چه صورت می بايست اطلاعات نمايش داده شوند .
زبان (Language) ، به مجموعه ای از کلمات معنی دار و با مفهوم که عده ای از آنها برای بيان خواسته ها ی خود استفاده می نمايند ،اطلاق می گردد . ( مثلا” زبان فارسی و يا انگليسی )

با کنار هم قرار دادن دو واژه اشاره شده ، با زبان نشانه گذاری مواجه خواهيم شد . زبان نشانه گذاری ، به مجموعه ای از کلمات معنی دار و با مفهوم که توسط عده ای (با آگاهی لازم انتخاب ) استفاده می گردد ، اطلاق می گردد. HTML ، نمونه ای مناسب در اين زمينه است . تمام افرادی که از تگ های HTML استفاده می نمايند ، بدرستی نسبت به مفهوم و جايگاه هر يک از تگ ها آشنائی داشته و با آگاهی کامل آنها را برای بيان خواسته های خود استفاده می نمايند. مثلا” مشخص است که استفاده از تگ <H1> چه نوع پيامدهائی را بدنبال خواهد داشت . تگ فوق ، توسط مولفين صفحات وب آگاهانه انتخاب می گردد و مرورگرها نيز متناسب با تعاريف از قبل مشخص شده ، واکنش مناسب خود را در رابطه با نحوه نمايش انجام خواهند داد. يک زبان بسط پذير(Extensible) ، زبانی است که دارای مکانيزم لازم برای افزودن کلمات بگونه ای است که توسط ساير استفاده کنندگان نيز قابل فهم باشد . در دنيای واقعی و در ارتباط با زبان های طبيعی ما هرگز شاهد چنين وضعيتی نخواهيم بود . ( افزودن يک واژه با معنی مورد نظر خود و استفاده از واژه با همان معنی توسط ساير استفاده کنندگان ) با توجه به تعاريف ارائه شده ، يک زبان نشانه گذاری بسط پذير ، می بايست يک زبان نشانه گذاری با قابليت افزودن کلماتی بيشتر باشد . در عمل زبان نشانه گذاری بسط پذير ، به سيستمی برای تعريف تمام زبا ن های نشانه گذاری با قابليت توسعه وضعيت موجود ، اطلاق می گردد .

SGML HTML و XML
SGML)Standard Generalize Markup Language) سرچشمه XML بوده و در سال ۱۹۸۸ استاندارد شده است . HTML)HyperText Markup Language) زبانی است که در ابتدا با استفاده از SGML تعريف گرديد. HTML يک زبان نشانه گذاری است ، بنابراين انتظار داريم شامل مجموعه ای از تگ ها بمنظور کنترل قالب و رفتار اطلاعات در مستندات باشد . XML ، يک زبان نشانه گذاری مشابه HTML نمی باشد . XML ، زيرمجموعه ای از SGML است ( مکانيزمی برای تعريف زبان های نشانه گذاری ) . XML همانند SGML يک زبان نشانه گذاری بسط پذير بوده اما بر خلاف SGML برای استفاده بر روی وب بهينه شده است .

مفاهيم اساسی
لازم است که مجددا” به اين نکته مهم اشاره گردد که XML ، يک زبان نشانه گذاری نبوده و در مقابل مکانيزمی برای ايجاد زبان های نشانه گذاری اختصاصی است . XML ، شامل مجموعه ای از استانداردها ی متنوع با کاربردهای خاص است . XML ، يک زبان نشانه گذاری نبوده و در عين حال يک زبان برنامه نويسی هم نيست . از XML برای ارائه اطلاعات استفاده شده و بمنظور پردازش اطلاعات، می بايست برنامه هائی نوشته گردد .
از XML در موارد زير می توان استفاده کرد :
● مبادله اطلاعات بين برنامه های نامتجانس ، بنگاه های تجاری و بانک های اطلاعاتی
● امکان فعال نمودن مدلی برای نمايش اطلاعات يکسان بر روی دستگاههای متفاوت با اهداف و خوانندگان گوناگون
● يک قالب ذخيره سازی مناسب برای داده ها

استانداردهای خانواده بزرگ XML
از واژه XML اغلب برای بيان يک استاندارد بين المللی استفاده می گردد . در برخی حالات واژه فوق برای بيان تمام استانداردهای مرتبط با XML نيز استفاده می گردد . اکثر کاربران با استانداردهای XML سرو کار ندارند. استانداردهای موجود اغلب توسط افراديکه نرم افزار توليد و يا بر روی سندهای XML پردازشی را انجام می دهند ، استفاده می گردد . شناخت استانداردهای موجود در اين زمينه مهم بوده و لازم است با جايگاه هر يک آشنا شويم . يکی از روش هائی که می توان استانداردهای موجود را بدرستی سازماندهی و بخاطر سپرد ، توجه و تمرکز بر اهدافی است که آنها دنبال می نمايند. جدول زير استانداردهای موجود بهمراه اهداف و قابليت های هر يک را نشان می دهد.

امکانات موجود هدف
XML
Namespaces
XML-Schemas تعريف يک زبان XML
CSS (Cascading Style Sheets)
XSL (Extensible Style Language)
XSLT (XSL Transformations) فرمت و نمايش سندهای XML
DOM (Document Object Model)
SAX (Simple API for XML)

XSLT پياده سازی برنامه
Such as:
SOAP (Simple Object Access Protocol)
SVG (Scalable Vector Graphics)
WML (Wireless Markup Language)
XCBL (XML Common Business Library) مبادله اطلاعات بين سيستم ها
در ادامه به بررسی هر يک از استانداردهای فوق و نحوه ارتباط آنها با يکديگر خواهيم پرداخت :

تعريف زبان های XML
با استفاده از XML ، می توان تگ های نشانه گذاری را تعريف که توسط مجموعه ای از مستندات که خصايص مشابهی را به اشتراک می گذارند ،استفاده گردد . مثلا” مجموعه ای از پيام های تجارت الکترونيکی. مورد فوق اصطلاحا” document type ناميده می گردد . ( مشابه يک کلاس در طراحی شی گراء ) . يک Document instance ، نوع خاصی از يک سند است . مثلا” يک ليست فروش خاص . در پروژه های XML ، در ابتدا Document types با توجه به اطلاعاتی که می بايست بر روی آنها عملياتی صورت پذيرد ، طراحی و در ادامه با ايجاد نرم افزارهای لازم ، اقدام به ايجاد و پردازش نمونه هائی از سند می گردد . XML مجموعه ای قدرتمند از بلاک های ساختمانی سطح پايين بمنظور طراحی Document types را ارائه می نمايد. نمونه سند زير، شامل مجموعه ای اطلاعات از يک بانک اطلاعاتی شخصی است .

مثال : يک سند XML شامل اطلاعات شخصی
<personnel-data>
<person ID=”PE1″>
<name>
<first-name>Webmaster</first-name>
<last-name>Admin</last-name>
</name>
<working-location office-id=”OF1″/>
<title>Web master and administrator</title>
</person>
<office ID=”OF1″>
<name>Head Office</name>
<address>Iran Avenue</address>
</office>
</personnel-data>

سند فوق شامل چندين بلاک ساختمان اساسی XML است .
● سند فوق ، دارای المان هائی است که قابل مقايسه با اشياء در سيتستم شی گراء و يا فيلد در بانک های اطلاعاتی رابطه ای است . يک المان با تگ شروع ، آغاز و با تگ پايان ، خاتمه می يابد . بين دو تگ شروع و پايان هر نوع اطلاعاتی می تواند قرار گيرد .
● يک المان می تواند دارای محتويات باشد. محتويات ، متن موجود بين تگ های شروع و پايان است . مثلا” Webmaster و Admin بعنوان محتويات المان در مثال فوق مشاهده می گردند.
● يک المان دارای خصلت است . خصلت ، شامل اطلاعات تکميلی بوده که در بخش تگ شروع مربوط به المان بصورت : نام و مقدار قرار می گيرند . در مثال فوق ID و office-id ، بعنوان خصلت مطرح بوده و محتويات آنها PE1 و OF1 ، بعنوان مقادير خصلت در نظر گرفته می شوند .
● يک المان می تواند تهی (Empty) باشد. در مثال فوق <Working-location> يک المان تهی است . معمولا” المان های تهی ، بعنوان فضا نگهدارنده هائی برای خصلت ها می باشند.
● المان ها می توانند شامل ساير المان ها باشند . ( المان های تودرتو ) . از المان های تودر تو برای ارائه اطلاعات سريال ( مجموعه ای از اشياء ، سطرهائی از داده و يا ساير اطلاعات مورد نظر ) استفاده گردد .

● خصلت می تواند شامل ساير خصلت ها ويا المان ها باشد .
● محتويات المان ها و يا مقادير خصلت ها ، می توانند بعنوان يک اشاره گر به ساير آيتم های موجود در سند نيز ايفای وظيفه نمايند.بمنظور نيل به هدف فوق XML روش های متعددی را ارائه نموده است . مثلا” خصلت office-id با مقدار OF1 ، درون <working-location > به خصلت ID المان <office> اشاره می نمايد. اشاره گره های فوق مشخص می نمايند که محل کار شخص PE1 در OF1 است .
بلاک های ايجاد يک سند XMl در عين سادگی ، دارای انعطاف و قدرت لازم بمنظور حمايت از روش های متفاوت مدل سازی اطلاعات می باشند : اشياء ، شبکه ای ، سلسله مراتبی، رابطه ای و …

خوش شکل ( Well-Formed ) و معتبر ( Valid )
با استفاده از XML ، می توان اقدام به ايجاد سندهای رسمی و غيررسمی نمود. در پروژه های کوچک و يا زمانيکه قصد نمونه سازی وجود داشته باشد ، می توان با سرعت اقدام به ايجاد سندهای “خوش شکل” نمود . در پروژه های بزرگ و يا پروژه هائی که شامل سيستم های متعددی می باشند، سندهای معتبر ايجاد می گردد.
قوانين يک سند خوش شکل
● وجود صرفا” يک المان ريشه
● هر المان غيرتهی دارای تگ های شروع و پايان است .
● تمام المان های می بايست با نظم خاصی تودرتو شده و هيچگونه تقابلی بين آنها وجود نداشته باشد.
يک سند XML زمانی معتبر است که اولا” خوش شکل بوده و ثانيا” :

● دارای يک Schema ( پيش نويس ) و يا DTD)Document Type Definition) باشد.
● سازگار با قوانين موجود در Schema
پيش نويس ها (Schemas) باعث اعتبار و صحت يک سند XML می گردند.
واژه Schema ، به قوانينی اطلاق می گردد که به مجموعه ای از سندهای با ساختار مشابه ، نسبت داده می شود . واژه فوق مختص XML نبوده و در ساير موارد از واژه فوق نيز استفاده می گردد . در رابطه با XML قوانين موجود به موارد زير اشاره خواهند داشت :
● از چه المان ها و خصلت هائی استفاده شده است ؟
● نحوه استقرار المان ها و خصلت ها به چه صورت است ؟
● هر يک از المان ها و يا خصلت ها شامل چه نوع اطلاعاتی می توانند باشند .
XML برای تعريف پيش نويس ها (Schemas) از دو زبان استفاده می نمايد : DTD و XML-Schema

DTD ، مکانيزمی برای تعريف پيش نويس ها بوده که در ابتدا بمنظور استفاده در SGML طراحی و در ادامه XML نيز از آن استفاده کرد . محوريت DTD بر سند استوار بوده و دارای امکانات و ويژگی های لازم نظير : نوع داده ها ، دامنه ها و … نمی باشد. گرامر استفاده شده در DTD کاملا” اختصاصی بوده و ابزارهای اندکی بمنظور پردازش آنها وجود دارد .
XML-Schema ، يک استاندارد جديد بوده که مختص XML طراحی شده است . گرامر استفاده شده مبتنی بر XML است . تکنولوژی فوق بدرستی محدوديت های DTD را برطرف نموده و اکثر ابزارهای توليد شده توسط عرضه کنندگان معتبر ، مجهز به تکنولوژی فوق می باشند. به افراديکه جديدا” به دنيای XML وارد شده اند ، توصيه می گردد که در صورت امکان گرامر DTD را فراموش و خود را با استاندارد XML-Schema وفق نمايند . 

چه زمان اعتبار لازم است ؟
سندهای “خوش شکل” ، بسرعت آماده شده و بسادگی استفاده می گردند. تاکنون نرم افزارهای متعددی نوشته شده که در آنها از سندهای ” خوش شکل” ، استفاده شده است . با اين اوصاف ،چه زمان می بايست از يک پيش نويس (Schema) رسمی استفاده کرد ؟ در پاسخ به سوال فوق می توان گفت که ” پيش نويس ها باعث ارائه صلاحيت لازم بمنظور پردازش های مبتنی بر داده ها می باشند . بدين ترتيب و در زمانيکه اطلاعات موجود در يک سند XML ، توسط يک پردازنده Schema ، پردازش می گردد، اطلاعاتی حذف و يا ناديده گرفته نخواهند شد. در اين راستا از پيش نويس های نوشته شده بمنظور : بررسی صحت محتويات، مقادير پيش فرض برای المان ها ، ارائه کمک در زمان ويرايش يک سند XML ، ترجمه از يک فرمت XML به فرمت ديگر ، استفاده می گردد .

در اين راستا ، می توان کدهائی را نوشت که تمام عمليات فوق را انجام دهند ولی کدهای نوشته شده محدود به يک نوع سند خاص خواهند بود . اطلاعات موجود در پيش نويس اين امکان را فراهم می آورند ، که با نوشتن يک پردازنده پيش نويس از آن در سندهای متفاوت بدون نياز به برنامه نويسی مجدد استفاده کرد . سندهای شامل پيش نويس ، با يک فرمت استاندارد ايجاد و بسادگی امکان اشتراک آنها فراهم می گردد .

Namespace مشکل تصادم اسامی را برطرف می نمايند
در زمان عمليات بر روی سندها و برنامه های مبتنی بر XML ، بدفعات نياز به ترکيب دو سند مجزا و ايجاد سند جديد احساس خواهد شد. با انجام هدف فوق، با چالش های جدی در رابطه با تصادم (Conflict) اسامی برخورد خواهيم کرد : المان هائی که دارای تگ های يکسان ولی معانی متفاوت می باشند .
مثلا” فرض نمائيد ، بخواهيم سندی که دارای يک تگ <title> ( تگ فوق به عنوان شغلی يک فرد اشاره دارد ) است را با سند ديگر که او هم دارای يک تگ <title> ( تگ فوق به عنوان يک فيلم اشاره دارد ) است را بايکديگر ترکيب نمائيم . زمانيکه تگ های فوق در سند های مجزا بوده و يا حتی در يک سند يکسان قرار داشته باشند با مشکلاتی مواجه نخواهيم شد ( در اين حالت قصد پردازش اتوماتيک بر روی المان های <title> را نداريم ) مشکل از زمانی شروع می گردد ، که کدهائی بمنظور پردازش اتوماتيک بر روی المان های <title> نوشته گردد . در چنين حالتی لازم است از نوع تگ آگاهی لازم را پيدا کرد .

بمنظور حل مشکل فوق از XML Namespace استفاده می گردد . Namespace ،مکانيزمی است که بهمراه يک سند تعريف ، تا ارتباط مفهمومی مجموعه ای از عناصر با يکديگر را مشخص نمايد. بدين ترتيب برای هر المان محدوده و يا فضائی تعريف و بر همين اساس با آنها برخورد عملياتی خواهد شد. برای هر Namespace می توان يک شناسه تعريف و در ادامه با استفاده از شناسه تعريف شده بصورت پيشوند در کنار نام المان تکليف عملياتی المان را مشخص کرد. مثلا” می توان يک NameSpace بصورت زير تعريف کرد :

Xmlns:Tehran=www.yourc ompany.com/test1
در ادامه می توان در سند مربوطه ، بصورت :<Tehran:Test1> به آن مراجعه کرد . بدين ترتيب شما و يا برنامه مورد نظر ، برای پردازش آگاهی لازم را پيدا خواهد کرد . ( تگ مورد نظر از Namespace تعريف شده مشتق می گردد )
خلاصه
در اين مقاله به سه استاندارد لازم بمنظور تعريف نوع سندهای XML اشاره گرديد : XML ، NameSpace و XML-Schema ( و يا DTD) . بمنظور تعريف يک نوع سند XML ، عمليات زير می بايست دنبال گردد :
● مدل سازی اطلاعات مورد نطر
● نمونه سازی با استفاده از سندهای XML “خوش شکل “
● در صورت نياز تعريف يک پيش نويس (Schema) رسمی
● استفاده از Namespace بمنظور ترکيب اطلاعات از منابع متفاو
XML چيست و چرا دارای اهميت فراوان است ؟ ( بخش دوم )

در بخش اول، مفاهيم اوليه تکنولوژی XML بررسی و پس از معرفی خانواده بزرگ تکنولوژی های مرتبط با XML ، سه استاندارد لازم بمنظور تعريف نوع سندهای XML تشريح گرديد ( XML ، NameSpace و XML-Schema ( و يا DTD) ) . در بخش دوم به بررسی نحوه انتشار سندهای XML خواهيم پرداخت .
Html بعنوان اسنانداردی جهت نمايش اطلاعات در عرصه وب ، سالها است که مطرح و استفاده می گردد. تگ های Html مسئوليت تبين نحوه نمايش اطلاعات را بر عهده خواهند گرفت . تکنولوژی فوق برای انجام وظايف محوله از پيش فرض های تعريف شده و ثابت (ايستا ) استفاده می نمايد . مثلا” با مشاهده تگ <B> دقيقا” مشخص شده است که می بايست چه نوع واکنشی صورت پذيرد. ( پر رنگ نمودن متن مورد نظر ) . نبايد انتظار داشته باشيم که با درج تگ <B> عملياتی غير از آنچه از قبل تعريف شده است صورت پذيرد. مفسر تگ های Html پس از انجام تفسير مربوطه ، واکنش از قبل تعريف شده ای را از خود نشان خواهد داد. مرورگرها بکمک مفسر های مربوطه همواره شرايط يکسانی را برای نمايش فراهم و شرايط خود را بر همه چيز منجمله سليقه و نقطه نظرات طراح و … ترجيج می دهند.

خودخواهی در نمايش و تحميل شرايط مربوطه از نکات قابل تامل در تکنولوژی فوق است . Html محدوده و مرزی را برای تفکيک داده ها از نمايش قائل نگرديده و با تلفيق دو مقوله فوق همواره از يک روش ثابت برای نمايش داده ها استفاده می نمايد. فرض کنيد که يک فايل html داشته و بخواهيم زمانيکه برای کاربر ارسال می گردد در مرورگر مربوطه ، به دو صورت کاملا” متمايز نمايش داده شود . برای نيل به خواسته فوق چاره ای نيست مگر اينکه دو فايل مجزای html را ايجاد که هر يک دارای خروجی اختصاصی خود باشند. در مثال فوق قصد ما نمايش داده های يکسان با فرمت های متفاوت از بعد نمايش است . ما بدنبال روش و يا روش هائی هستيم که قادر به تفکيک بين داده و نمايش باشد. قطعا” Html در اين راستا گزينه ای مناسب نخواهد بود. سندهای Html از تگ هائی نظير <H1> و <P> بمنظور ايجاد ساختار و از تگ هائی نظير <I> و <Font> بمنظور ايجاد فرمت نمايش اطلاعات استفاده می نمايند . در اين راستا عملا” هيچگونه تگی که نشاندهنده نوع اطلاعات و محتويات سند باشد ، وجود ندارد .بدين ترتيب مفسر قادر به تفسير تگ های فوق صرفا” در حد نمايش اطلاعات بوده و امکان انجام هيچگونه پردازشی وجود نخواهد داشت .

حل مشکل با استفاده از XML
Xml بين دو مقوله داده و نمايش تفکيک قائل شده است. در تکنولوژی فوق بدليل عدم وجود تگ های از پيش تعريف شده برای نمايش اطلاعات می توان سناريوی مربوط به نحوه نمايش اطلاعات را بکمک يک تکنولوژی ديگر تعريف و تبين نمود. اطلاعات ذخيره شده بصورت Xml را می توان با حالات متفاوت و اعمال سناريو های متفاوت نمايش داد. برخلاف Html تکتولوژی Xml دارای اطلاعات از قبل تعريف شده و مشخصی برای نحوه نمايش اطلاعات نيست. تگ های تعريف شده در يک سند XML ، بصراحت ساختار و محتويات را ارائه خواهند داد . در اين حالت می توان نرم افزارهائی را طراحی نمود که قادر به انجام عمليات دلخواه بر روی اطلاعات موجود در سند XML باشند . هنوز يک مسئله وجود دارد : در تگ های تعريف شده در سند XML ، آيتمی وجود ندارد که به کامپيوتر اعلام نمايد به چه صورت می بايست اطلاعات مربوط به هر يک از المان ها فرمت ، تا خوانندگان قادر به خواندن آنان باشند . ما به چيزی بيشتر بمنظور تدوين استراتژی نمايش اطلاعات نياز داريم .

زبان های تعريف سبک XML
بمنظور حل مشکل اشاره شده می توان اطلاعات مربوط به نحوه نمايش اطلاعات را در يک فايل مجزا قرار داده و در ادامه با استفاده از يک پردازنده Stylesheet فايل فوق را با سند XML ترکيب نمود. Stylesheet توسط زبان های Style نوشته می گردند. هر شخص می تواند زبان اختصاصی خود را در اين زمينه پياده سازی و استفاده نمايد ولی XML با دو زبان استاندارد ارائه شده است .

CSS)Cascading Style Sheets)
CSS يک زبان Style بوده که بمنظور استفاده در سندهای Html ابداع گرديده ولی بخوبی قادر به فعاليت در کنار سندهای XML نيز می باشد . CSS مکانيزمی مناسب برای نمايش يک سند XML در مرورگر ها است . اکثر ابزارهای توليد صفحات وب دارای امکانات لازم برای توليد اسکريپت های CSS می باشند . CSS دارای دو محدوديت عمده است . اولا” ، قادر به توليد خروجی مناسب و با کيفيت بالا نمی باشد. ثانيا” ، صرفا” باعث تزئين سند شده و قابليت تغيير در دنباله اطلاعات موجود در سند را نخواهد داشت . محتويات يک سند XML در اغلب حالات دارای يک نطم متفاوت نسبت به حالتی است که قصد نمايش آنها را داريم .در اين راستا لازم است قبل از استفاده از CSS بمنظور نشر يک سند ، سند مورد نظر به حالتی که تمايل به نمايش آن را در خروجی داريم ، تبديل گردد . بدين ترتيب يک مرحله پردازش ديگر به حجم عمليات اضافه خواهد گرديد.

XSL)Extensible Style Language)
XSL يک زبان مبتنی بر XML است که دارای محدوديت های اشاره شده در رابطه با CSS نمی باشد . متاسفانه در حال حاضر ابزارهای لازم برای ايجاد اسکريپت های XSL محدود بوده و در برخی حالات ممکن است نوشتن اسکريپت ها بصورت دستی انجام گيرد . XSL دارای سه ويژگی منحصر بفرد بوده که هر کدام دارای استاندارد اختصاصی خود می باشند.
– Tranformation)XSLT) . ويژگی فوق باعث انتقال يک سند XML به فرمت ديگر می شود. فرمت فوق می تواند يک سند XML ديگر و يا يک سند DHTML باشد .
– Pointing)XPath) . ويژگی فوق امکان مشخص نمودن هر مکان در يک سند XML را فراهم می نمايد . پتانسيل فوق بعنوان هسته اساسی پردازش Style Sheet مطرح بوده و مکانيزم لازم در خصوص اعمال قوانين نمايش در خصوص اطلاعات موجود در سند XML را بدون نياز به استفاده از تگ های مربوط به Style در بطن و همراه سند ، فراهم می نمايد .
– Formating)XSL) ، فرآيندی است که بر اساس آن امکان اعمال فرمت مورد نظر به اطلاعات، بدون نياز به نوشتن دستورالعمل ها ئی که مختص يک دستگاه خروجی خاص می باشند ، را فراهم می نمايد . مثلا” می توان قوانينی مشابه : ” تمام عناوين می بايست بصورت پررنگ ، فونت تايمز ، در وسط قرار گرفته ، و دور آنها يک کادر کشيده شده که دارای پهنای N باشد ” را بسادگی تعريف کرد . ويژگی فوق يک تحول چشمگير نسبت به وضعيت فعلی است . در اين راستا الزامی به نوشتن قوانين متعدد برای هر يک از دستگاههائی که قصد حمايت از آنان را داريم ، وجود نخواهد داشت .

StyleSheets چگونه کار می کند ؟
مهمترين اصل تمام زبانهای XML Style ، کمک به طراحان بمنظور ايجاد قوانين ، نسبت دهی و دستورالعمل های پردازش برای انواع اطلاعات موجود در يک سند است . قوانين در يک Stylesheet در تمپليت ها قرار گرفته و به المان ها و الگوهای اطلاعاتی موجود ، اشاره خواهند کرد .در زمان اجراء ، يک نرم افزار کوچک که پردازنده StyleSheet ناميده می شود ، سند XML و يک StyleSheet را بعنوان ورودی اخذ خواهد کرد ( پردازنده Stylesheet ، درون هر برنامه ای که Stylesheet را به XML اعمال می نمايد ، نظير مرورگرها و يا ابزارهای طراحی صفحات وب وجود دارد) . پردازنده بر اساس دستورالعمل های موجود در Stylesheet عمليات مورد نظر را انجام و بر اساس تمپليت تعريف شده اطلاعات ذيربط را در آن درج و باعث ايجاد يک خروجی جديد بعنوان ماحصل کار می نمايد. روش فوق برنامه نويسی تعريفی در مقابل رويه ای ناميده می شود ( در اين حالت قوانين مربوط به نحوه نمايش تعريف شده اند، نه اينکه دستورالعمل های رويه ای در متن کدها استفاده شده باشد ) . نمونه کدهای زير ، يک تمپليت XSLT را ايجاد که در آن المان <title> در زمان ايجاد تگ های Html ، درشت نوشته شده خواهند شد .

مثال : يک تمپليت ساده XSLT
<xsl:template match=”title”>
<H1>
<xsl:apply-templates/>
</H1>
</xsl:template>

در تمپليت فوق ، خصلت match دارای مقدار title بوده و اين بدين معنی است که قانون می بايست به هر المان موجود در <title> که پردازنده Stylesheet آن را در سند XML پيدا خواهد کرد ، اعمال خواهد شد. قانون موجود در تمپليت به اين نکته اشاره دارد که محتويات المان <title> در سند XML ، می بايست در فايل Html که ايجاد خواهد شد ، درج و قبل از آن تگ <H1> و بدنبال آن تگ <H1/> آورده شود . فرض کنيد فايل XML مشابه زير باشد :
مثال : سند XML که فايل XSLT بر روی آن اعمال می گردد
<title>This text will be very large</title>

نتيجه فايل HTML پس از اعمال تمپليت تعريف شده :
<H1>This text will be very large</H1>
مثال فوق نمونه ساده ای در اين زمينه بوده و در عمل می توان با استفاده از امکانات موجود، تمپليت های بمراتب پيچيده تر و قدرتمندتری را ايجاد نمود.
StyleSheet و افزايش انعطاف پذيری
با تفکيک دستورالعمل های فرمت اطلاعات از محتويات اطلاعات و در ادامه استفاده از مکانيزم Stylesheet بمنظور ترکيب آنها با يکديگر ، قابليت های فراوانی در اختيار علاقه مندان به اين تکنولوژی قرار خواهد گرفت :
• می توان StyleSheet های متفاوتی را برای دستگاه های متفاوت ( مرورگرها ، PDA ، تلفن ) بر روی محيط های اطلاعاتی متفاوت ( online ، چاپ ، CD ) و با اهداف متفاوت ( نمايش مديريتی ، نمايش تکنيکی ) ايجاد نمود .
• می توان يک Stylesheet ايجاد و آن را بر روی سندهای متعددی اعمال نمود.
• می توان اطلاعات را ويرايش و StyleSheet آنها را يکديگر تفکيک خواهد کرد .
• می توان تمام اطلاعات موجود را ، صرفا” با فشردن با يک کليد ، منتشر کرد.
خلاصه
استانداردهای اساسی در زمان انتشار سندهای XML شامل CSS و XSL/XSLT است . مهمترين نکات در رابطه با تکنولوژی های فوق ، عبارت است از :
• جدا سازی محتويات از فرمت نمايش
• نسبت دهی Style به ساختار
• استفاده از CSS بمنظور تزئين اطلاعات
• استفاده از XSLT در زمانيکه به الگوهای قدرتمندی نياز است .
(بخش اول) ( بخش سوم )
XML چيست و چرا دارای اهميت فراوان است ؟ ( بخش سوم)

در بخش اول، مفاهيم اوليه تکنولوژی XML بررسی و پس از معرفی خانواده بزرگ تکنولوژی های مرتبط با XML ، سه استاندارد لازم بمنظور تعريف نوع سندهای XML تشريح گرديد ( XML ، NameSpace و XML-Schema ( و يا DTD) ) . در بخش دوم به بررسی نحوه انتشار سندهای XML اشاره گرديد . در اين بخش ،نحوه پردازش سندهای XML و دلايل توجه جدی به اين تکنولوژی ، تشريح می گردد .

پياده کنندگان نرم افزار در زمان استفاده از XML علاقه مند به کار در دو سطح متفاوت می باشند : پردازش های سطح پائين و پردازش های سطح بالا. در پردازش های سطح پائين ، تمام سند خوانده شده و به بخش های مورد نظر برای پردازش ، تقسيم می گردد . در پردازش های سطح بالا ، از ابزارهای لازم برای انجام فعاليت های سطح پائين استفاده شده و در برخی حالات نيز لازم است که کدها و اسکريپت های خاصی نوشته شده تا پردازش های لازم بر روی يک سند XML صورت پذيرد . برای پردازش های سطح پائين ، می بايست از استانداردهای موجود در رابطه با Parsing استفاده کرد . در پردازش های سطح بالا ، می بايست از استاندارد تبديل XML استفاده کرد .

پارسر (Parser)

هر پردازنده XML ( مرورگرها ، پردازنده های Schema ، ويرايشگرها ، پردازنده های Stylesheet ) دارای يک پارسر می باشند . پارسر يک سند XML را خوانده و آن را به بخش های متفاوت تقسيم و در حافظه مستقر می نمايد .( معيار تقسيم بندی می تواند بر اساس المان و يا خصلت باشد ) . پس از استقرار بخش های متفاوت يک سند XML در حافظه ، امکان انجام عمليات بر روی هر يک از بخش های موجود توسط پردازنده فراهم می گردد . ( نظير داده های موجود در يک بانک اطلاعاتی ) :
• انتقال يک سند از يک فرمت به فرمت ديگر
• بازسازی مجدد يک سند XML با توجه به اولويت های اطلاعاتی مورد نظر
• اعمال فرمت های دلخواه بمنظور چاپ و يا نمايش

اکثر پياده کنندگان نرم افزار های مبتنی بر XML ، ضرورتی به فراگيری جزئيات مربوط به نحوه پارسينگ ، نداشته و می توانند آن را به ابزارهای ارائه شده توسط توليدکنندگان واگذار نمايند . (در محيط های پياده سازی امکانات مربوطه در اين زمينه پيش بينی می گردد) . با مطالعه پارسر های XML ، شناخت مناسبی نسبت به امکانات و ويژگی های موجود، ايجاد خواهد شد . XML دارای دو اينترفيس برنامه نويسی DOM و SAX است .

DOM)Document Object Model) بر خلاف نام خود يک مدل واقعی نيست . DOM يک API ( اينترفيس برنامه نويسی ) برای نوشتن کدهای لازم بمنظور انجام عمليات دلخواه بر روی بخش هائی از يک سند XML پس از استقرار آن در حافظه است . رفتار استاندارد فوق با اطلاعات موجود در يک سند XML ، استفاده از يک ساختار درختی برای ذخيره سازی اطلاعات ، بهمراه دستوراتی برای حرکت در طول درخت و بازيابی اطلاعات مورد نظر است . دستورات بر اساس يک مدل شی گراء عمل می نمايند. مهمترين مزيت پارسرهای سازگار با DOM ، ارائه استانداردهای لازم API بمنظور انجام عمليات دلخواه در رابطه با اطلاعات است .

SAX)Simple API for XML) ، بر اساس يک مدل شی گراء رفتار نمی نمايد. در اينترفيس فوق ، از مجموعه ای رويداد استفاده می گردد . رويدادها، پس از خواند ن يک سند XML توسط پارسر های سازگار با SAX ، با توجه به شرايط مربوطه ، فعال خواهند شد. يکی از دلايل مطرح شدن SAX با توجه به وجود DOM ، عدم امکان استفاده از دستورات DOM تا زمانی است که تمام سند در حافظه مستقر گردد . استفاده و بکارگيری از دستورات DOM صرفا” پس از استقرار تمام سند XML در حافظه امکان پذير خواهد بود . بديهی است با توجه به رويکرد عملياتی فوق ، حجم بالای سندهای XML می تواند باعث بروز مسائل و مشکلاتی در اين رابطه گردد . مثلا” بمنظور دستيابی به يک المان خاص می بايست در انتظار استقرار تمام سند XML در حافظه گرديد .( از دست دادن زمان و مصرف بيهوده حافظه ) . با استفاده از تکنولوژی SAX می توان بسرعت يک سند را فعال و در ادامه المان های موجود را بمنظور استفاده از محتويات مورد نظر جستجو کرد .

قابليت SAX ، يک پيش نياز برای پارسرهای سازگار با DOM است ، چون يک پارسر DOM می بايست در ابتدا سند را خوانده و در ادامه از رويدادهای مشابه SAX بمنظورتشخيص المان ها استفاده و آنها را در حافظه ايجاد نمايد . بعنوان جمع بندی می بايست به اين نکته اشاره گردد که اغلب پارسرها امکانات مربوط به DOM و SAX را حمايت کرده و می توان از پارسر های مشابه بمنظور انجام هر يک از حالات پردازش استفاده کرد .