تكامل وب و مقايسهء ابزارهاي جستجو در اينترنت

چكيده

اين مقاله تكامل وب را در رابطه با وب و فناوري‌هاي بازيابي اطلاعات بررسي مي‌كند. در اين بررسي بين عناصر مختلف وب در زمينهء نمايه‌سازي و صفحات جستجوي وب وجه تمايز وجود دارد. ده ابزار اصلي و مهم وب براساس معيارهاي انتخاب و تعداد اتصال‌ها با يكديگر مقايسه و ارزيابي شده‌اند. ابزارهاي جستجو مانند راهنماها و موتورهاي جستجوگر نيز مورد بررسي و مقايسه قرار گرفته‌اند.

كليدواژه : وب، راهنماهاي جستجوگر، موتورهاي جستجوگر

مقدمه
كلمه اينترنت مخفف “Interconnected Networks” و به معني شبكه‌هاي به‌هم‌مرتبط است. اينترنت سيستمي براي توزيع و تبادل اطلاعات در سطح جهان است كه براساس آخرين آمار موجود در حال حاضر ۲۲۶ كشور به آن متصل هستند. اين مجموعه به همراه فناوري‌هاي ساده كاربردي، سبب كاهش هزينهء نشر الكترونيكي شده است (۱).در هر صورت، وب يك عنصر منسجم و واضح مستقل نيست، بلكه دو عنصر مجزاي وب وجود دارند: وب قابل‌رويت و ديدني، و وب نامرئي و غيرقابل رويت(۲).

براي فهم كاربرد اين دو عنصر و براي ارزيابي اطلاعات ضرورت دارد كه از موضوع خارج شويم و ببينيم چگونه صفحات وب توليد مي‌شوند.
دو نوع صفحهء وب وجود دارند: استاتيك و ديناميك.
صفحات وب استاتيك توسط طراح وب، در خدمات‌دهندهء وب نصب مي‌شوند و براي هر كس و هر چيزي كه وب سايت را مشاهده كند قابل دسترس‌اندو هر تغييري هم بايد به صورت دستي انجام شود.
صفحات وب ديناميك توسط رايانه با به‌كارگيري دستورهاي يك زبان دستنوشته(۱) و اغلب «سي‌جي‌آي‌جاوا»(۲)كه به عنوان پلي بين سرويسگرهاي پروتكل انتقال ابرمتن (۳) و كاربران وب عمل مي‌كند، ايجاد مي شود.

دستورهاي يك زبان دستنوشته، نتايج را در يك صفحهء خالي وب جا مي‌دهند و به كاربر، صفحهء وب ديناميك را ارائه مي‌دهند. صفحات وب استاتيك اطلاعات عام و كلي را براي كاربر تهيه مي‌كند، در حالي كه صفحات وب ديناميك، اطلاعات منحصربه‌فرد را براي كاربر تهيه مي‌نمايند. صفحات وب استاتيك براي همهء كاربران قابل رويت‌اند و در دسترس مي باشند.

صفحات وب ديناميك صفحات وب استاتيك
توسط رايانه توليد مي‌شوند دستي توليد مي‌شوند.
اطلاعات منحصربه‌فرد است اطلاعات عام و كلي است
قابل نمايه‌سازي نمي‌باشند اكثر آن‌ها قابل نمايه‌سازي هستند

اولين مطالعه در موسسه تحقيقاتي «ان‌ئي‌‌سي» در پرينستون آمريكا در دسامبر سال ۱۹۹۷ نشان داد كه صفحات وب قابل رويت، حداقل ۳۲۰ ميليون صفحهء وب را شامل مي‌شوند، در حالي كه دومين مطالعه تخمين زد كه تعداد صفحات وب رشد كرده و به ۸۰۰ ميليون صفحه در فوريه سال ۱۹۹۹ رسيده‌اند. در هر صورت، اكثر ناشرين اطلاعاتشان را بر روي وب به وسيلهء پايگاه‌هاي اطلاعاتي بزرگ توزيع مي‌كنند. اين اطلاعات اساسا جنبه تجاري دارد (۲).
موتورهاي جستجوگر(۴) و راهنماهاي وب

۲٫ ۱٫ راهنماهاي وب
چه تفاوتي بين راهنماي وب و موتور جستجو وجود دارد؟
راهنماي وب:
الف. فهرستي از سايت‌هاي وب كه از قبل تعيين شده‌اند، مي‌باشد؛
ب. توسط ويراستاران جمع‌آوري شده؛
ج. براساس موضوع و عنوان طبقه بندي شده؛
د. انتخابي است.

با توجه به اين كه راهنماهاي وب توسط افراد جمع‌آوري مي‌شوند, تصميم‌گيري دربارهء كيفيت محتواي هر يك از سايت‌هاي وب قبلا انجام شده است. در نتيجه راهنماهاي وب در اينترنت بسيار مورد مراجعه قرار مي‌گيرند، زيرا كاربران به دنبال موضوعات خاصي در اينترنت هستند كه اين راهنماها، نقطهء شروع خوبي در تشخيص بهترين‌ها در وب مي‌باشند.

در كاربرد راهنماهاي وب، كاربر مي‌تواند در بين فهرست‌‌هاي راهنما حركت نمايد. راهنماهاي اصلي وب همچنين اجازهء عبور از ديگر موتورهاي جستجو را هم مي‌دهند. مثلا بزرگ‌ترين راهنماي وب، يعني «ياهو»، اجازهء عبور از موتور هاي جستجوي ديگر را مي‌دهد.
سايت‌‌هاي وبي كه به وسيلهء راهنماي وب نمايه‌‌سازي شده‌اند، به علت روند تكميل به صورت دستي، در آن راهنماها باقي مي‌مانند؛ مگر اين كه به احتمال بسيار ضعيف به صورت دستي حذف شوند. در حالي كه وجود دائمي يك ليست يا يك فهرست در موتور جستجو هميشه ضمانت نمي‌شود، اما ساختن و حضور دائمي يك فهرست در يك راهنماي وب مثل «ياهو» امكانپذير مي‌باشد.

۲٫ ۲٫ موتورهاي جستجوگر
وقتي كه يك موتور جستجوگر را به كار مي‌بريد، كاربر، پايگاه اطلاعاتي سايت‌هاي وب را جستجو مي‌نمايد. همه موتورهاي جستجوگر داراي سه جزء تركيبي هستند:
الف. «اسپايدرها»(۵)كه سايت‌هاي وب را بررسي مي‌كنند،
ب. فهرست‌ها و نمايه پايگاه اطلاعاتي؛
ج. نرم‌افزار بازيابي اطلاعات.

۲ . ۲ .۱٫ اسپايدرهاي موتورهاي جستجوگر
پايگاه اطلاعاتي موتورهاي جستجوگر ابتدا توسط «اسپايدرها» ساخته مي‌شود و توسط موتورهاي جستجوگر به مأخذ اصلي اعزام مي‌شود.«اسپايدرها» برنامه‌هايي هستند كه وب را به دنبال صفحات جديد وب جستجو مي‌نمايند، كلمات را نمايه‌سازي مي‌كنند و اتصال را به صفحات برقرار مي‌نمايند، سپس كلمات نمايه‌شده را با آد‌رسي كه به يك صفحهء وب يا هر منبعي كه بر روي وب جهاني و به طور كلي اينترنت قرار دارد اشاره مي‌نمايد,(۶) مقابله مي‌كنند.

۲٫ ۲ .۲٫ نمايهء پايگاه اطلاعاتي موتور جستجو
اين بخش عنصر اصلي از هر موتور جستجو است. اين همان چيزي است كه كاربر به دنبال آن است. در طي سال ۱۹۹۸ تعدادي از توليد‌كنندگان موتورهاي جستجو آغاز به كار كردند. اين شركت‌ها نمايه‌ها را مطابق با معيارهاي گوناگون ساختند. بطور مثال مي توان از نمايهء «دايركت هيل» و «گوگل» (۷) نام برد و نيز «نمايهء ‌نام‌هاي حقيقي» (۸) كه شركت‌ها را قادر مي‌سازد واژه‌هاي كليدي خود را براي حمايت از محصولات خود ثبت نمايند.

۲ . ۲ . ۳ . نرم‌افزار بازيابي اطلاعات
تمامي موتورهاي جستجوگر، نرم‌افزار مختص به خود براي پاسخگويي به سوالات دارند.
موتورهاي جستجوگر مطابق با قوانين مشابه به شرح زير عمل مي‌نمايند: هر سايت وب شامل كلمات يا واژه‌هايي است كه سوءال كاربر را با آن‌ها مقابله مي‌كند. و در صفحهء نمايش، به صورت فهرست‌وار نمايش مي‌دهد و با توجه به سوال كاربر و ارتباط موضوعي، فهرستي از مطالب را طبقه‌بندي مي‌نمايد. تفاوت مختصري در چگونگي كار الگوريتم‌ها بين موتورهاي جستجو وجود دارد، كه دليلي بر اين مدعااست كه كاربران، با يك پرسش واحد, از موتورهاي مختلف نتايج متفاوتي را كسب مي‌نمايند. در هر صورت، دليل مهم ديگر اختلاف نتايج جستجو، نسبت پايين همپوشاني، در بين موتورهاي جستجو‌گر مي‌باشد.

۳ . پورتال‌ها
«پورتال»(۹) ها سايت‌هاي وبي هستند كه خود عرضه‌كنندهء خدمت خاصي نيستند، ولي مراجعين را به صورت ساده و دوستانه به اطلاعات و سايت‌هاي موردعلاقه‌شان هدايت مي‌كنند. «پورتال» ها نقاط اصلي براي راهبردهاي تجارت الكترونيكي هستند و به تدريج از سال ۱۹۹۴ به وسيلهء سه نوع شركت اينترنتي به وجود آمدند. اين شركت‌ها كه نقش اساسي در توزيع زنجيرهء اطلاعاتي براي كاربر ايفا مي‌كنند به شرح زير مي‌باشند:

الف. توليدكنندگان خدمات اينترنتي(۱۰)
ب. سايت‌هاي جستجو(۱۱)
ج. توليدكنندگان مرورگر(۱۲)
سايت «اكسايت»(۱۳) نمونه‌اي كه از يك سايت پورتال موفق است(۱).
۴٫ توسعه و تكامل فناوري جستجو

همهء ما تكامل زندگي بشر بر روي كره خاكي را به خاطر داريم. همانطور كه همگي ما مي‌دانيم، شكل‌هاي مختلف زندگي سلولي براي مدت‌هاي بسيار طولاني قبل از تكامل زيستي وجود داشته است. در هر صورت هنگامي كه به اين نقطه از تكامل دست يافتيم، تغييرات به فرم سازمان‌يافتهء آن در مدت زمان كم‌تري به انجام رسيد.

همين مطلب براي فناوري جستجوي وب نيز صادق است. با تاكيد بر روي پور‌تاليزيشن و تجارت الكترونيكي، اولين نسل سايت‌هاي جستجو، عملاً و به تدريج فراموش شدند و اين در حالي است كه آن‌‌ها تا سال‌‌هاي متمادي، حكومت اصلي را به عهده داشتند؛ اما بدليل اين كه نتوانستند خودشان را با تغييرات محيطي وفق بدهند، فراموش گرديدند و انواع جديدي از توليدكنندگان جستجو به بهره‌برداري رسيدند.

۴ .۱٫ موتورهاي جستجوي ماورا
موتورهاي جستجوي ماورا(۱۴) به كاربر اين امكان را مي‌دهند كه از ميان موتورهاي جستجوي متعدد و راهنماهاي وب به طور مقارن و همزمان، جستجو نمايد (۲و۳).
محبوب‌ترين موتورهاي جستجوي ماورا به شرح زير مي‌باشند:

– Dogpile ( www.dogpile.com )
– Mamma ( www.mamma.com )
– 2Q ( www.2q.com )
– Infind ( www.infind.com )
– Insleuth ( www.isleuth.com )
– Surfy ( www.surfy.com )
– Webtaxi ( www.webtaxi.com )

۴ .۲٫ نسل اول موتورهاي جستجو كه توسط سايت‌هاي وب بصورت«اسپايدر», نمايه‌سازي را ايجاد كردند، انبوهي از واژه‌ها و كلمات را تجزيه و تحليل نمودند. راهنماهاي وب به طور دستي گردآوري شدند و از آوريل ۱۹۹۸ مورد بهره‌برداري قرار گرفتند: يكي از اين راهنماها به نام «دايركت هيل»(۱۵)يك حركت ريشه اي را آغاز كرد و اصلاحاتي انجام داد و روش خود را «راه سوم»(۱۶) ناميد.

اين راهنماي وب ادعا مي‌‌كرد كه در زمان جستجو، كنترل با كاربر است و نتايج به صورت طبقه‌بندي شده بر روي سايت وب نمايان مي‌شوند. اين موتور جستجو، آنچنان كه ادعا مي‌كرد نتوانست خدمات منحصربه‌فردي را ارائه نمايد. بنابراين موتور جستجوي ديگري به نام «هاتبات»(۱۷)به جاي آن توليد شد (۲).