ارباچ (۱۹۹۰) یکی از چندین نویسنده ای است که بر ضرورت نمایه سازی مجموعه های تصویری براساس دیدگاه بهره گیران تاکید دارد. او این مسئله را اینگونه بیان میکند:

هدف  تحلیل موضوعی، دستیابی به ماهیت یک تصویر با گروهی از تصاویر – محتوای اصلی و درون مایه – است، درحالی که باید بر عناصری که مورد علاقه بهره گیران میباشد نیز تاکید کرد. ( ص. ۱۸۴)

ترنر (۱۹۹۵) اصطلاحاتی که بهره گیران برای استفاده در تصاویر (در اینجا تصویر متحرک) انتخاب کرده بودند را با اصطلاحاتی که قبلاً در نمایه سازی به تصاویر اختصاص داده شده بود یا با توصیف های کوتاو نوشته شده دربارهٔ تصاویر مقایسه کرد. او به سطح بالایی از همخوانی دست یافت.

اصطلاحاتی که برای بحث دربارهٔ روش های نمایه سازي تصاویر مورد استفاده قرار میگیرند کاملاً منسجم نیستند. بعضی از نویسندگان، مثل مصطفی (۱۹۹۴)، بین نمایه سازی شفاهی ” (یعنی بازنمود متنی یک تصویر) و نمایه سازی تصویری ” (استخراج مشخصه ها و در نتیجه نقاط دستیابی از خود تصویر) تفاوت قائل شده اند. این تمایز کاملاً روشن به نظر می رسد و یک سیستم بازیابی میتواند هر دو نوع نمایه سازی را در بر داشته باشد. سایر نویسندگان، ازجمله راسمی ویتن” (۱۹۹۷)، ترجیح داده اند که از اصطلاحات مفهوم پایه و محتوی پایه ” برای اشاره به این دو نوع نمایه سازی استفاده کنند. به نظر میرسد که اصطلاح محتوی پایه مترادف با اصطلاح تصویری یا تصویر پایه باشد اما به نظر نمی رسد که اصطلاح مفهوم پایه دقیقاً معادل نمایه سازی شفاهی باشد. راس میو بین از اصطلاح مفهوم پایه برای اشاره به نمایه سازی انسانی استفاده کرده است در حالی که اصطلاح محتوی پایه به نمایه سازی خودکار از روی خود تصاویر اشاره دارد.

در آثار گیودی وادا و راگاوان (۱۹۹۷) و داسمیوسن (۱۹۹۷) میتوان به روش های مختلفی برای توصیف و بازیابی تصاویر دست یافت، درحالی که در تحقيقي گريمسون ۱ میوندی ” (۱۹۹۴) وضعیت فعلی بینایی رایانه ای مورد بررسی قرار گرفته است. استفاده از این فن آوری برای بازیابی کارآمد در پایگاه های تصویری – از طریق روش های غیرشفاهی – بسیار ضروری است.

گیوپتا” و جین (۱۹۹۷) مروری کوتاه اما مفید دربارهٔ بازیابی اطلاعات بصری ارائه داده اند. به هرحال، همانطور که دربارهٔ بسیاری از افراد که از سایر رشته ها به این حوزه وارد می شوند مصداق دارد، آنها دربارهٔ بازیابی اطلاعات و مشکلات مربوط به آن اطلاعات ناقصی ارائه داده اند. مثلاً در مقاله آنها تشویق شده است که:

اکنون بهره گیران می توانند محتوای اطلاعات تخیلی – ابر داده و مشخصه های بصری – رااز رسانه های بصری – به سادگی جستجو در مدارک متنی – استخراج، ذخیره و بازیابی نمایند. (ص. ۷۱)

افرادی مثل ما که بیش از سی سال در این حوزه کار کرده اند میدانند که بازیابی مدارک متنی از پایگاه های اطلاعاتی – با هر حجمی – بسیار دشوار است و اصلاً ساده نیست.این حقیقت وجود دارد که محققینی از سایر حوزه های علوم که به نمایه سازی و مشکلات آن علاقمند شدهاند، از اصطلاحاتی تازه برای ایده های قدیمی استفاده کردهاند. مثلاً پیکارد و مینکا (۱۹۹۵) از اصطلاح شرح برای اشاره به اختصاص دادن یک برچسب شفاهی به یک تصویر (یعنی نمایه سازی ان) استفاده کرده اند.

همانطور که پیش از این نیز در این فصل اشاره شد، نویسندگان متعددی تاکید کرده اند که یابی کارآمد تصاویر فقط براساس انطباق صرفی تصویر حاصل نمی آید و هنوز نوعی برچسب گذاری متنی ضرورت دارد. کاوکل (۱۹۹۴) با اشاره به این مشکل اظهار داشته است: – هرچه تصاویر پیچیده تر باشند، برای بهرهگیر ارائهٔ مثالی قابل استفاده و بصری دشوارتر خواهد بود. همچنین انطباق تصویر الگو با سایر تصاویر نیز دشوارتر میگردد. ممکن است  الگوهای سه بعدی نیاز به انطباقی داشته باشند؛ دراینجا است که مشکل افزایش مییابد. اگر بهرهگیر به بازیابی تصاویری علاقمند باشد که در بردارنده یک شیء خاص باشد، درجهٔ .دشواری افزایش بیشتری می یابد صواریخ فزایش بیشتری می یا با به مثلاً، اگر یک بهره گیر بخواهد همهٔ تصاویری که در آنها ماشین وجود دارد” را بازیابی کند، توصیفی یک ماشین با استفاده از نرم افزارهای هنری و طراحی موجود چندان دشوار نیست. وقتی یک درخواست تصویری از ماشین به پایگاه ارائه می شود، باید بتوان تصویر یک ماشین را از میان سایر تصاویر – بدون توجه به شیوه ارائه آن – بازابابی کرد. (ص، ۱۲۹)