فهرست نويسي صفحات وب و اینترنت

چکیده
درعصر حاضر که دوره پیشرفت سرسام آور فناوری بالاخص فناوری های اطلاعاتی و ارتباطی است، کمتر حرفه ای را می بینیم که فناوری رنگ تازه ای به آن نداده و یا در آن تغییر و تحول ایجاد نکرده باشد. علوم کتابداری و اطلاع رسانی نیز همپای دیگر علوم نه تنها از این پیشرفت ها مصون نمانده است، بلکه خود نیز به عنوان یکی از تجلی گاههای عمده فناوری های جدید اطلاعاتی و ارتباطی از جمله اینترنت می باشد.

در اولین سالهای ظهور اینترنت در کتابخانه ها به هیچ وجه گمان این همه تاثیرات عمیق این فناوری جدید بر کارکردهای کتابخانه نمی رفت. امروزه کتابداران با چالش های جدیدی در حرفه خود روبرو هستند، از جمله حوزه فهرستنویسی و سازماندهی از اینترنت بسیار تاثیر پذیرفته است و از آنجایی که خود اینترنت نیز به عنوان یک محمل اطلاعاتی جدید و از طرفی دیگر حجم روزافزون منابع اطلاعاتی موجود در اینترنت در حال افزایش است، باعث شده که کتابداران را در پی یافتن راههای بهتر و مطمئن تر جهت کسب اطلاعات دقیق تر، مفید تر و سریع تر از این محیط جدید، به تلاش و تکاپو وادارد.

آنچه در دهه های گذشته ذهن کتابداران را به خود مشغول داشته است، بحث آینده سازماندهی و تغییر قالب منابع اطلاعاتی و چگونگی سازماندهی، دسترسی و اشاعه این نوع منابع بوده است. کتابداران با توجه به ضعف اینترنت در سازماندهی منابع اطلاعاتی در تلاش هستند که روش های مناسبی را ذخیره سازی و بازیابی بهتر و مناسب تر اطلاعات به کار گیرند.

کلیدواژه ها: فهرستنویسی وب. فهرستنویسی اینترنت

يكي از اهداف جامعه پيشرفته در علوم و فنون، ايجاد توازن مطلوب بين دانش توليد شده و اطلاعات توليد شده است. امروزه رسيدن به اين هدف نگراني زيادي را بوجود آورده است. ليكليدر(۱۹۹۶) در اين باره سه راه حل پيشنهاد كرده است:
۱- كاهش شديد ميزان انتشارات.

۲- بهينه سازي طرق بازيابي و انتخاب مدرك متناسب با نيازها.
۳- ارتقاي راههاي آماده سازي محتواي اطلاعاتي مدرك.

مورد اول قابل قبول نيست. در مورد گزينه دوم ليكليدر مي كوشد تا ميزان برخورد استفاده كنندگان و مجموعه اطلاعاتي را از طريق توصيه روشهاي پيشرفته فكري و ماشيني جهت انتخاب مدارك مناسب با نيازها تقليل دهد. پيشنهاد سوم وي به مراتب برتر از مورد دوم بوده و شامل روشهاي پيشرفته فكري و

ماشيني جهت آماده سازي اطلاعات موجود در مدرك است. در اين مرحله است كه سازماندهي اطلاعات مي تواند تا حد زيادي راهگشاي مشكلات باشد.
سازماندهي منابع دانش يكي از اركان اساسي علم كتابداري است و پيشينه آن به قدمت خود انسان و تاريخ علم است، چرا كه بدون استفاده از يك روش متناسب علمي و منطقي و نظم عالي نمي توان به راحتي به منابع اصلاعاتي دسترسي پيدا كرد. هدف عمده و اساسي فهرستنويسي، سازمان دادن به مجموعه مواد و منابع كتابخانه است تا از اين طريق بتوان كتاب مورد نياز را از مجموعه موجود، سريع تر بازيابي كرد.

همان طور كه از اين تعريف مي توان استنباط كرد، هدف عمده فهرستنويسي نظم و سازمان دادن به مجموعه مواد و منابع است و تفاوتي ندارد كه اين مواد و منابع به چه فرمت و محملي باشند. سازمان دادن به منابع چه چاپي و چه الكترونيكي از مهمترين وظايف و كاركردهاي علوم كتابداري و اطلاع رساني است.
به طور كلي كاركردهايي كه از فهرست و فهرستنويسي انتظار مي رود به شرح زير است:
۱- كاربران را از وجود انواع مواد و منابع آگاه مي كند(شناسايي)

۲- در انتخاب دقيق منابع و جستجوي منابع مناسب به كاربران كمك مي كند. به كمك تمام اطلاعات موجود در فهرست، كاربران مي توانند به اطلاعات مورد نظر از طريق نقاط دسترسي گوناگون دست يابند.(گزينش و دسترسي)
۳- با استفاده از كدها و استانداردها، امكان بازيابي و ذخيره يكپارچه اطلاعات براي همگان فراهم مي شود.(بازيابي)

به طور دقيق تر هدف فهرستنويسي، تهيه شناسه براي مجموعه منابع كتابخانه ( اعم از كتاب و ديگر اشكال منابع ) بر اساس نياز مراجعه كنندگان است و موجب شناسايي بهتر و كامل تر اثر مي گردد. روند فهرستنويسي در نقش پالايه اي براي زدودن اطلاعات زائد عمل مي كند. وظيفه فهرستنويسي، جدا نمودن اطلاعات شاخصي است كه بدان وسيله يك اثر شناسايي و بازيابي مي شود. اين نياز چه در محيط هاي چاپي و چه در محيط وب و اينترنت بسيار ملموس است و با توجه به اينكه سازماندهي منابع دانش و اطلاعات از وظايف اوليه و بنيادين كتابداران مي باشد، لذا شايسته است تا فهرستنويسان و كتابداران در جهت سازماندهي محمل هاي جديد اطلاعاتي كه روز به روز در حال افزايش است، نهايت كوشش و دقت را به عمل آورند.

سازماندهي اطلاعات از اركان اساسي محيط علمي به شمار مي آيد، چرا كه بدون وجود نظم و ترتيب، دستيابي به منابع اطلاعاتي با هزينه زماني و اقتصادي گزافي صورت مي گيرد. در طول تاريخ كتابداري محيط ها و دوره هاي متفاوتي را شاهد بوده ايم كه در هر يك براي دستيابي به اطلاعات، سازماندهي اطلاعات وجود داشته است و پيوسته سير تكاملي خود را ادامه مي دهد.

يكي از مهمترين تحولات نيمه دوم قرن بيستم، ظهور و گسترش پديده اينترنت است كه تاثيرات شگرفي بر كتابداري و سازماندهي داشته است. اين تاثيرات تقريبا دوجانبه بوده است، از سويي اينترنت خود امكانات و تسهيلات زيادي جهت سازماندهي اطلاعات فراروي كتابداران مي گذارد و از طرفي خود نيز تحت تاثير روشهاي سازماندهي مرسوم در كتابداري قرار مي گيرد.

اينترنت به منزله پديده اي اطلاعاتي مداوم در حال تغيير و توسعه است. اين شبكه كه از آن به شبكه شبكه ها نيز تعبير مي شود، حرفه كتابداري را با حجم عظيمي از اطلاعات الكترونيكي مواجه ساخته است و در نتيجه بر آن نيز اثر گذاشته است. اطلاعات موجود در اين شبكه از بهترين ابزارهاي بهبود كيفيت كار كتابخانه ها محسوب مي شود. اين پهنه عظيم اطلاعات خود با مشكلي بزرگ تر به نام سازماندهي اينترنت روبرو است، كه در صورت عدم سازماندهي نمي توان كارآيي مفيدي را از آن انتظار داشت.

اهداف و كاركردهاي اينترنت را مي توان به صورت زير بيان كرد:
۱- توليد اطلاعات: اينترنت يكي از نوين ترين ابزارهاي توسعه و پيشرفت علوم است و در سايه وجود آن، علوم جديدي متولد شدند و بر غناي علوم ديگر نظير ارتباطات و اطلاع رساني و علوم رايانه افزوده شده و خود نيز وسيله اي در جهت توليد اطلاعات شد.
۲- سازماندهي اطلاعات: اين مهم به خوبي و به صورت يكپارچه رعايت نشده است و هر سايت و موتور كاوش داراي الگوريتم خاص خود است. بعلاوه وجود ميليون ها سايت نياز فراواني به سازماندهي دارند تا جستجو و بازيابي در اينترنت را با اهداف كتابداري و اطلاع رساني تطبيق دهند.
۳- اشاعه اطلاعات: اينترنت به عنوان يك رسانه ارتباطي و محمل اطلاعاتي جديد كار اشاعه اطلاعات را به طور همه گير و جهاني برعهده دارد.

علاوه بر اين، جستجو و بازيابي اطلاعات در اينترنت داراي مشكلات خاص خود است. اين مشكلات از چهار عامل مهم ناشي مي شوند:
۱- عدم كنترل بر نوع و سطح حجم عظيم اطلاعات وارده.

۲- عدم ثبات در سايت ها و صفحات و مدارات الكترونيكي.
۳- عدم استفاده از روشها و راهبردهاي مرسوم براي سازماندهي اطلاعات.
۴- گوناگوني موتورهاي جستجو از نظر مكانيسم هاي نمايه سازي، جستجو و بازيابي اطلاعات.

يكي از راهكارهاي جلوگيري از مشكلات پديد آمده در زمينه جستجو و بازيابي اطلاعات در اينترنت، استفاده از تجربيات فراواني است كه كتابداران و اطلاع رسانان سالهاست در زمينه سازماندهي دانش ( فهرستنويسي، نمايه سازي و رده بندي ) به كار مي گيرند. توليد كنندگان اطلاعات، طراحان صفحات و موتورهاي كاوش مي توانند با بهره گيري از شيوه هاي سازماندهي اطلاعات كه توسط كتابداران به كار گرفته شده، راهبردي سازنده در دسترسي به اطلاعات از طريق اينترنت ارائه كنند.

چرا بايد اينترنت را فهرستنويسي كنيم؟
اينترنت همچون يك مغازه سمساري است كه همه چيز در آن يافت مي شود و فهرستي براي آن وجود ندارد. يك فرد بي تجربه مي تواند ساعت هاي مديدي غرق در جستجوي بي فايده اينترنت شود. حتي جستجوهايي كه با منطق كافي شروع شوند ممكن است در فضاي نامتناهي شبكه گم شوند.طي ساليان دراز تلاش مي شده است تا راهي پيدا شود كه نوعي كنترل بر اطلاعات موجود در اينترنت اعمال شود، لكن، هنوز كسي نمي تواند بگويد كه اينترنت بسامان شده است. تغئيرات در اينترنت آنقدر سريع و زياد است كه كوششهاي آغاز شده براي سازماندهي اطلاعات موجود در اينترنت پس از چند ماه ناروزآمد مي شوند. به همين دليل تعدادي از متخصصين يك سال وب را ۶ تا ۹ هفته مي دانند. به عبارت ديگر، تغئيراتي كه طي سال در جامعه رخ مي دهد، طي ۶ تا ۹ هفته در جامعه اينترنتي اتفاق مي افتد. به دليل تغئيرات سريع، سازماندهي در اينترنت چالشي قابل توجه است.

بر طبق آمار تا نيمه دوم سال ۲۰۰۰ بيش از ۱/۲ ميليارد صفحه اطلاعات، بدون تكرار و قابل دسترسي بر روي وب موجود بوده و نرخ رشد انفجاري صفحات وب ۷ ميليون صفحه در روز تخمين زده شد. بازيابي اطلاعات مناسب در ميان چنين حجم عظيمي از اطلاعات، بدون سازماندهي اطلاعات وب، شديدا به مخاطره مي افتد.

اگر كتابداران بخواهند از مخاطرات شبكه در امان باشند برداشتن سه گام ضروري است:
۱- بايد راههاي مشخص براي دسترسي وجود داشته باشد كه امكان اشتباه كردن و از دست دادن زمان را كاهش دهد.
۲- بايد دانش كافي در حوزه هاي مورد علاقه فردي كه به جستجو مي پردازد وجود داشته باشد.

۳- بايد نسبت به افزوده ها و روش هاي جديد جستجو در اينترنت هوشياري مستمر وجود داشته باشد.
شيوه هاي كنوني نمايه سازي اطلاعات كه اساس كار موتورهاي كاوش اينترنت قرار گرفته است، نيازهاي كاربران اين پديده رو به گسترش را به طور كامل برآورده نمي كند. نمايه سازي اساس كار موتورهاي جستجو در رتبه بندي و تركيب منطقي واژه ها براي بازيابي اطلاعات در اينترنت را تشكيل مي دهد كه در هر موتور، اين وظيفه بر عهده بخشي به نام عنكبوت وب يا خزنده وب است كه مدام كار مرور و بازديد از سايت ها را برعهده دارد و آنها را به موتور جستجو انتقال مي دهد كه حاصل آن بازيابي موتور كاوش است كه نمايش داده مي شود.

آرلن جي. تيلور و پاتريك كلمسون در تحقيق كه در سال ۱۹۹۵ انجام دادند، ضعف هاي موتورهاي كاوش را به اين صورت بيان كردند:
۱- در يك مجموعه از يافته هاي بازيابي شده، مدخل هاي تكراري فراواني مشاهده مي شود.
۲- نتايج غير قابل پيش بيني هستند.

۳- نتايج گاهي اوقات گمراه كننده هستند. ممكن است جستجويي در يك موتور كاوش نتيجه اي نداشته باشد، ولي در موتور ديگر داراي يافته هاي فراوان باشد.
۴- موتورهاي كاوش محتويات پايگاههاي اطلاعاتي خودشان را نشان نمي دهند و از معيارهايي كه براي گنجاندن يك مدرك در فايل هايشان دارند حتي شرحي ارائه نمي كنند.

۵- كنترل واژگاني وجود ندارد و قواعد نقطه گذاري و بزرگ نويسي نيز استاندارد نيست.
۶- بدون بررسي عملي هر عنصر، اغلب نمي توان ميزان ربط و رابطه ها را تحليل كرد، يعني اطلاعات كافي در مدخل نمايه موجود نيست تا فرد بتواند دست به انتخاب مناسب بزند.

۷- اغلب جستجو ها كم ربط يا نامرتبط هستند.
۸- عدم بازيابي بسياري از منابع ارزشمند به علت قرار گرفتن در وب پنهان.
در حالي كه منابع اينترنت به صورت يكپارچه سازماندهي نشده اند، تنها مسير ممكن براي بازيابي اطلاعات مطلوب همين موتورهاي كاوش هستند. ماندل و ولون رابطه بين اصول دسترسي كتابشناختي چارلز امي كاتر را با منابع اينترنتي مورد بررسي قرار دادند. آنها به بررسي ارزش و اهميتي پرداختند كه جمع آوري اسامي مولفان، تعئين نقش مولفان، كنار هم گذاشتن آثار و نسخه ها و تهيه دسترسي موضوعي به منابع وب از طريق رده بندي و واژگان كنترل شده، در بازيابي دارد. ودوارد با دليل اثبات مي كند كه در حال حاضر اينترنت در وضعيت هرج و مرج مانندي از نظر سازماندهي و دسترسي قرار دارد و جستجويي كه معمولا فقط با موتورهاي جستجوي كليد واژه اي انجام مي شود، متناسب با نيازهاي بيشتر استفاده كنندگان نمي باشد.

ايده نسبتا مشابه ديگري نيز توسط داد بيان گرديده است. وي معتقد است كه انفجار اينترنت و وب جهان گستر باعث افزايش تلاش هاي نيمه حرفه اي به منظور تهيه انواع دستيابي موضوعي به منابع اينترنت از طريق راهنماي سلسله مراتبي در موتورهاي جستجوي وب، مانند ياهو شده است. اين رويكردهاي سلسله مراتبي براي دسترسي موضوعي بر مبناي ابزارهاي آزمايش شده و قابل پذيرشي مانند رده بندي دهدهي ديديي، فهرست سرعنوانهاي موضوعي كتابخانه كنگره و جز آن نيست و بنابر اين نتايج بدست آمده از هر موتور جستجو با ديگر موتورهاي جستجو متفاوت است. اين مساله توسط داد كه ساختار و اصول فهرستهاي سلسله مراتبي گوناگون را بررسي مي كرد، مشاهده گرديد و آنها را با طرحهاي رده بندي دهدهي ديديي و كتابخانه كنگره و فهرست سرعنوانهاي موضوعي كنگره مقايسه نمود.

نيكلسون و ديگران طرح تحقيقاتي CATRIONA كه هدفش تحقيق و بررسي نيازمنديهاي فني، سازماني و مالي جهت توسعه نرم افزارهاي كاربردي و روشهايي براي فهرست نويسي و رده بندي و بازيابي مدارك و ديگر منابع اينترنتي بود را گزارش مي دهد.

مشكلات جستجو و بازيابي و راهكارهاي كنوني موتورهاي كاوش در ذخيره و بازيابي اطلاعات پاسخگوي كاربران نيست و در اينجاست كه تواناييهاي متخصصان كتابداري و اطلاع رساني كه حاصل سير تكامل اصول و قواعد سازماندهي در طول چندين قرن است، مي تواند راهگشاي اين مشكل باشد و ايجاد روش هاي كاربر گرا چه در پايگاههاي اطلاعاتي دستي و چه در پايگاههاي اطلاعاتي رايانه اي كه حاصل تلاش كتابداران بوده است، گواه اين مدعاست.
فهرست كتابخانه ها ديگر تنها سياهه اي از منابعي كه به طور فيزيكي در كتابخانه ما دسترس پذير باشند نيست، بلكه فهرست كمك مي كند تا منابع مفيد در هر كجا كه باشند، بازيابي شوند. فهرستنويسي منابع اينترنتي هم بر اين هدف استوار است.

ضرورت هايي كه در فهرستنويسي منابع اينترنتي دخيل‌اند عبارتند از:
۱- وجود مسائل و مشكلات جستجو و بازيابي اطلاعات در اينترنت از طريق موتورهاي كاوش كه علاوه بر اتلاف وقت زياد، علاقه مندان را از دستيابي به منابع مفيد محروم مي كند.
۲- توانايي ها و مزاياي فهرست هاي كتابخانه اي در سازماندهي اطلاعات و حل مشكلات جستجو و بازيابي اطلاعات.
۳- امكان فراهم آوري دسترسي به منابع ارزشمندي كه به طور روزافزون به اينترنت افزوده مي شود و كتابخانه ها هزينه كمي براي تهيه آن مي پردازند.

۴- ايجاد و گسترش كتابخانه هاي ديجيتالي كه نياز به سازماندهي و ايجاد راهكارهاي مناسب بازيابي منابع اينترنتي هم يكي از ملزومات آن خواهد بود.
با ايجاد موتورهاي جستجو توسط متخصصان كامپيوتر، اين تصور ايجاد شد كه مساله بازيابي اطلاعات حل شده است. اما موتورهاي جستجو فقط به نمايه

سازي اينترنت پرداختند و مساله سازماندهي اطلاعات به بوته فراموشي سپرده شد. پس از مدت كوتاهي همگان متوجه شدند كه موتورهاي جستجو نمي توانند نيازهاي بازيابي را به خوبي پوشش دهند و بازيابي موارد غير مرتبط يا داراي ارتباط كم باعث هدر رفتن وقت استفاده كنندگان مي شود و سرعتي كه اينترنت و تكنولوژي اطلاعات فراهم مي كند از اين طريق مستهلك مي گردد. به اين ترتيب با وجودي كه كاربران مي توانند با كمترين اطلاعات ممكن اقدام به بازيابي نمايند، گستردگي موارد بازيابي شده عملا باعث خنثي شدن اين قابليت مي گردد.

كمتر موتور جستجويي در اينترنت را مي توان يافت كه بر اساس اصول سازماندهي و نمايه سازي كه حداقل در طول سده اخير در كتابخانه ها و مراكز اطلاع رساني مورد استفاده هستند، طراحي شده باشند. به جاي فهرستنويسان، كار سازماندهي اطلاعات در اينترنت بر عهده موتورهاي جست و جو است كه هريك به شيوه اي متفاوت و بدون استفاده از رويكردهاي كتابدارانه به شناسايي و نمايه سازي منابع اطلاعاتي مي پردازند.

با توجه به تجربيات كتابخانه ها بهترين راه حل براي اين مساله را مي توان سازماندهي مواد در اينترنت دانست و مجددا با توجه به همين تجربيات بهترين روش يعني تقسيم بندي موضوعي را انتخاب كرد.

نكات گفته شده اين واقعيت را نشان مي دهد كه نياز به يك نظام فهرست گونه در اينترنت اجتناب ناپذير است. از آنجا كه اين فهرست بايد حاوي محتويات تمامي سايت هاي موجود باشد مي توان از آن به عنوان فهرستگان اينترنت نام برد. براي تحقق اين فهرستگان لازم است راهكارهايي جهت يكدست ساختن اطلاعات كتابشناختي منابع موجود ارائه گردد.

چه کسی اینترنت را فهرستنویسی می کند؟
اینترنت در فهرست های رایانه ای محلی سراسری کشور و جهان فهرست می شود. پروژه او.سی.ال.سی برای فهرستنویسی اینترنت در سال ۱۹۹۱ با ۳۱ فهرستنویس داوطلب برای فهرست کردن یک نمونه آغاز شد. یافته های کلیدی این پروژه عبارت بودند از:
– منبع توصیف شده روش مطلوبی به نظر می رسید.

– با وجود آشنایی با فهرستنویسی فایل های رایانه ای، استفاده از اطلاعات آموزشی درباره فهرستنویس منابع اینترنتی مجاز بود.
در واکنش به این یافته ها، فهرستنویسی منابع اینترنتی: دستنامه و راههای عملی توسط نانسی اولسون منتشر شد و فیلد ۸۵۶ یو.اس.مارک ابداع و پیشنهاد و فهرست اینترکت آغاز شد. جول بیان می کند:

” فهرست اینترکت وحدت رویه جستجو در فهرست و مجموعه عملکردهای متداول آن یعنی جستجوی کلیدواژه ای و عبارتی، جستجو در نمایه منتخب و عملکردهای بولی با دسترسی مستقیم به منابع اینترنتی را نشان می دهد. سطح اولیه دسترسی به امکان جستجو که مورد انتظار کاربر برای بازیابی یک کتاب معمولی بود، به مجموعه ای از منابع اینترنتی گسترش یافته بود. به زودی فروشندگان سیستم های کتابخانه ای به اصلاح تولیدات خود پرداختند تا از قابلیت ارتباطی فیلد ۸۵۶ بهره مند گردند و فهرست های رایانه ای مبتنی بر وب متولد شدند.”