چکیده
چند رسانه ای ترکیبی از متن، گرافیک، صوت، انیمیشن و ویدئو است. چند رسانه ای در تجارت، در مدرسه، در خانه و در مکانهای عمومی مورد استفاده قرار می گیرد.
تمام سیستم های فشرده سازی به دو الگوریتم نیاز دارد: یکی برای فشرده ساز ی داده ها در منبع و یکی برای تجزیه آنها در مقصد. این الگوریتم ها را الگوریتم های رمزگذاری و رمز گشایی می نامند. الگوریتم های رمز گذاری به دو دسته تقسیم می شوند: رمز گذاری آنتروپی و رمز گذاری منبع. رمزگذاری آنتروپی، رمزگذاری طول دنباله است و رمزگذاری منبع با استفاده از امتیازات خواص داده ها، فشرده سازی بیشتری را تولید می کند.

MIDI به معنای رابط دیجیتال تجهیزات موسیقی، استاندارد ارتباطات است که در اوایل دهه ۱۶۸۰ برای تجهیزات موسیقی الکترونیکی و کامپیوترها ارائه شد. سه فرکانس نمونه برداری که معمولا در سیستم های چند رسانه ای به کار می روند: KHz 4401 ، KHz 22 ، KHz 11025 با کیفیت .CD – quality اندازه نمونه ها نیز ۸ بیتی یا ۱۶ بیتی است.
ساختن فایلهای صوتی دیجیتال نسبتا ساده است. اطلاعات صوتی دیجیتال با کیفیت بالا فضای زیادی را روی دیسک اشغال می کنند.

Bitmap ماتریس ساده ای از اطلاعات است که نقاطی منحصر به فرد را تسریع می کند. تصاویر ( JPEG، اتصال گروه تخصصی عکاسی) برای فشرده سازی تصاویر ساکن یکنواخت ( مثل عکس ) توسط متخصصین عکس برداری که تحت حمایت آی تی یو، آی اس آ، آی ئی سی کار می کردند توسعه یافت.

در جهان امروزی از سه استاندارد ویدئویی استفاده می شود NTSC، PAL،SECAM این قابها و استاندارد ها به آسانی قابل تبدیل به یکدیگر نیستند.
MPEG توسط Moving Picture experts Group ایجاد شد. اینها الگوریتم های مهمی هستند که برای فشرده سازی تصویر به کار می روند و از سال ۱۹۹۳ به عنوان استاندارد بین المللی اند. ام پی ئی جی می تواند صوت و تصویر را فشرده کند.
DVI تکنولوژی فشرده سازی قابل برنامه ریزی است.

Quick Time طرحهای فشرده سازی دیگری از جمله Kodak photo CD، Super Mac Codec Compact Disc Vidio , Codec را شامل می شود.

مقدمه
چند رسانه ای، ستاره درخشنده ای در افلاک است. صوت و تصویر با استفاده از آن دیجیتال شده و به طور الکترونیکی منتقل می شوند تا نمایش داده شوند. اغلب پروژه های چند رسانه ای از استانداردهای ام پی ئی جی استفاده می کنند و داده ها را از طریق اتصال های ای تی ام عبور می دهند. ام بون، خدمات رادیو، تلویزیون دیجیتال جهانی تجربی در اینترنت است.

ابزارهای اصلی ساخت پروژه های چند رسانه ای، شامل یک یا چند نرم افزار تألیف در برنامه های ویراستار تصویر، صوت و فیلم است. علاوه بر این، تعدادی برنامه کاربردی دیگر نیز وجود دارند. که جهت capture کردن صفحه، تبدیل فرمت های مختلف فایل و انتقال فایل ها بین کامپیوتر های مختلف مورد استفاده قرار می گیرند. آنچه که در یک سیستم چند رسانه ای مشاهده می شود ترکیبی از متن، Icon و bitmap های شبکه، عکس، گرافیک های ترسیم شده برداری، نمایش های سه بعدی و پنجره های مربوط به تصاویر اشیاء متحرک می باشد.

عناصر گرافیکی در اندازه های مختلفی وجود دارند. رنگ یا طرح خاصی می پذیرند. مرئی یا نامرئی می شوند و… . چگونگی ترکیب این عناصر با یکدیگر، انتخاب رنگها و فونت ها، روشهای به کار گرفته شده برای جلب توجه بیننده، …… دانش و خلاقیت طراح بستگی دارد در طول حیات بشر، از زمانی که اولین فیلم ثابت به وجود آمد. مردم شیفته ی تصاویر متحرک شدند. اکنون فیلم ویدئویی جزئی از سیستم های چند رسانه ای است در مجموع ویدئویی دیجیتال از مهمترین اجزای چند رسانه ای و ابزار نیرومندی در جهت نزدیکتر کردن

کاربران کامپیوتر به جهان واقعی محسوب می شود. از میان اجزای چند رسانه ای، ویدئو بیشترین حجم حافظه را اشغال می کند. تصاویر رنگی، حافظه زیادی در حد مگا بایت اشغال می نمایند. هنگامی که در تصاویر ویدئویی، حرکت ایجاد می شود، چند بار در ثانیه ( در حدود ۳۰ بار ) جایگزین هم می شوند و بدین منظور ۳۰ برابر حافظه مورد نیاز است.

( ۱/۸ گیگا بایت در دقیقه یا ۱۰۸ گیگا بایت در ساعت ). امروزه تبدیل داده ویدئویی دیجیتال به جریان اطلاعات مغناطیسی، از مهمترین تکنولوژی ها و تحقیقات چند رسانه ای است. با بکارگیری برد فشرده ساز تصاویر ویدئویی، می توان از صدای quality – CD استفاده کرد. همچنین می توان با نصب تعدادی دیسک سریع، نرخ انتقال داده را افزایش داد و با استفاده از دستورات سیستم تألیف، داده های ویدئویی را سریعتر به RAM منتقل نمود.

CD – ROM ها وسیله توزیع بسیار خوبی، برای تصاویر ویدئویی کامپیوتری فراهم می کنند هر چند هزینه زیاد است اما دارای ظرفیت بالایی هستند.
ارسال و دریافت فیلم در شبکه
فیلمهای ویدئویی در خواستی فیلمهایی هستند که در منزل قابل انتخاب اند که به کمک کنترل راه دور تلویزیون صورت می گیرد.
کارگزارهای فیلم ویدئویی که همزمان، تعداد زیادی از فیلمها را ذخیره و پخش نماید.
شبکه توزیعی مجموعه ای از راه گزین ها و خطوط بین منبع و مقصد است.
ست تاپ باکس از این کار مستلزم خرید بردی است که حاوی تراشه های خاص و دو شاخه ای برای اتصال به شبکه توزیع محلی است.
ستون فقرات چند پخشی
جمعیت اینترنت در حال پیاده سازی سیستم چند رسانه دیجیتال ام بون را می توان به عنوان رادیو یا تلویزیون اینترنت تصور کرد.

فصل ۱

در این فصل می خوانید :

• چند رسانه ای چیست ؟
• تعاریف
• فشرده سازی چیست ؟
• الگوریتم های فشرده سازی
• موارد استفاده از چند رسانه ای

چند رسانه ای چیست ؟
نمایشهای دیداری و شنیداری همواره یکی از روشهای مؤثر آموزش و تبلیغات بوده است. اگر کاربر هم ببیند وهم بشنود تأثیر بیشتری می پذیرد. اما اگر بتوان به طریقی با ارائه دیداری و شنیداری رابطه دو طرفه برقرار کرد به خاطرسپاری اطلاعات به مراتب بیشتر می شود. بنابراین باید کاربر را به دخالت در پروژه واداشت در جنبه تصویری، می توان تصاویری از نمودارهای آماری مناظر زیبا، گروه هایی از تصاویر مرتبط با هم و حتی تصاویر گرافیکی سه بعدی تخیلی داشت. قطعات ویدیویی ( که می توان به صورت دیجیتالی ساخت یا از دوربین فیلمبرداری یا

دستگاه ضبط و پخش ویدئویی وارد کرد ) و قطعات متحرک نیزچشمها را خیره می کنند. حتی می توان جلوه های صوتی، جملات ضبط شده، موسیقی و ورودی های صوتی را به همراه تصاویر به کار گرفت. با آنکه در چند رسانه ای کمتر به متن اشاره می شود، اما می توان گفت متن مهمترین بخش در ارائه ی چند رسانه ای است. کلمات و گفته ها و تصاویر همراه آنها، باید به دقت انتخاب شوند تا بر بیننده یا شنونده تأثیر بگذارند. اگر قلم حروف و اندازه ی آنها درست انتخاب شوند و در جای مناسب قرار گیرند، اثر بیشتری در ذهن بیننده خواهند داشت.
ایجاد ارتباط دو طرفه در تصاویر باعث می شود که کاربر مطالب ارائه شده را به خوبی درک کند.
کاربر باید بتواند بر تصاویر کنترل داشته باشد و از طریق یک تصویر به راحتی تصویر مرتبط با آن را پیدا کند.

تعریف چند رسانه ای
هر تعریفی از متن، گرافیک، صدا، انیمیشن و تصاویر ویدئویی که از طریق کامپیوتر یا سایر تجهیزات الکترونیکی که در اختیار کاربر قرار می گیرد ، چند رسانه ای نامیده می‌شود.
چند رسانه ای نمایش نیرومند احساسات است. برای عرضه خواسته های مردم به صورت الکتریکی باید اجزای چند رسانه ای ، مانند تصاویر ثابت و متحرک ، اصوات ، تصاویر ویدئویی و اطلاعات خام با هم ترکیب شوند. اگر افراد با کامپیوتر محاوره داشته باشند ، مجذوب می شوند. چند رسانه ای، چشمها ، گوشها ، انگشتان و بخصوص مغز را تحریک می کند. اجزای چند رسانه ای باید به گونه ای با هم ترکیب شوند، که بیشترین کارایی را داشته باشند. تولیدکنندگان نشر رومیزی ها و تصاویر ویدئویی که می خواهند روشهای قدیمی اطلاعات را تغییر دهند و عقاید خود را با تکنولوژی جدید پیاده کنند، از چند رسانه ای استفاده می کنند افراد با ذوقی که می خواهند آلبوم ها و تاریخچه زندگی خانوادگی خود را در شبکه ی

جهانی Web قرار دهند، نیز چند رسانه ای را به کار می گیرند. چند رسانه ای مورد استفاده بازرگانانی است که می خواهند مستندات واژه پردازها و نشر رومیزی ها همراه صدا ، تصاویر ویدئویی و تصاویر گرافیکی متحرک عرضه کنند ، یا سخنگوهای بزرگی که برای انتقال فکر و اطلاعات خود ، از صوت و نمایش تصاویر متحرک بر مانیتورهای بزرگ استفاده می کنند. چند رسانه ای های مورد استفاده، سیستم های اطلاعاتی است که تصاویر ، صدا ، ویدئویی و متن را سازمان دهی میکنند. اساتید و دبیران برای آموزش از نمایش اطلاعات استفاده می کنند.
چند رسانه ای برای شروع کار و سرمایه گذاری در سخت افزار و نرم افزار و فراگیری ابزارهای جدید بسیار مناسب است. در آغاز، اجزای چند رسانه ای را بشناسید. سپس یک یا چند ابزار را برای ایجاد و ویرایش هر کدام فراگیرید. باید بتوانید از متن و فونتها استفاده کنید، یک تصویر گرافیکی تمام رنگی ایجاد نموده ، آن را ویرایش نمایید با استفاده از تصاویر به فیلم ها روح بخشید و صداهای دیجیتال را ضبط و ویرایش کنید.

ایجاد یک پروژه چند رسانه ای نیاز به مهارت و تکنولوژی بالایی دارد ، همان اندازه که مهارت ها در ایجاد یک پروژه مؤثر است ، جدیت و سختگیری مدیر نیز اهمیت فراوان دارد.
تعاریف
همانطور که گفته شد ، چند رسانه ای ترکیبی از متن ، گرافیک ، صوت ، انیمیشن و ویدئو است.
هنگامی که به کاربر نهایی ( کسی که محصول نهایی را می بیند ) اجازه کنترل اجزای چند رسانه ای داده می شود ، این چند رسانه ای ، محاوره می باشد. هنگامی که در تمام مدت استفاده کاربر، ساختاری از اجزای متصل شده فراهم شود ، به چند رسانه ای محاوره‌ای ، ابر رسانه می گویند.
افرادی که نحوه استفاده هر یک از اجزا و تکنولوژی ترکیب آنها را بدانند ، توسعه دهندگان چند رسانه ای نامیده می شوند.

ابزارهای نرم افزاری ، متن ها و مطالب نمایش داده شده بر یک کامپیوتر یا صفحه تلویزیون با هم یک پروژه چند رسانه ای را تشکیل می دهند. هنگامی که پروژه به دست کاربران نهایی می رسد ، به این پروژه با ساختارهایش یا بدون آنها عنوان چند رسانه ای گویند. بعلاوه ممکن است پروژه ، صفحه ای در شبکه Web باشد که در این صورت باید اجزای چند رسانه ای در HTML ، ترکیب شوند.

پروژه چند رسانه ای که محاوره ای نباشد ، چند رسانه ای خطی نامیده می شود و هنگامی که اجرا می شود ، تا انتها پیش می رود. اگر کاربران بتوانند پروژه را کنترل کنند به این پروژه چند رسانه ای غیر خطی یا محاوره ای گویند. چند رسانه ای غیر خطی ، راهی برای دست یابی به اطلاعات است. برای این که کاربر بتواند از پروژه استفاده کند. باید در پیغام ها ، Scripting ، Storyboarding ، کارهای هنری و برنامه نویسی دقت بسیار داشت.
از ابزارهای تألیف برای ترکیب اجزای چند رسانه ای در یک پروژه استفاده می شود. این ابزارهای نرم افزاری، اجزای چند رسانه ای را مدیریت می کند و نحوه برخورد با کاربر را تعیین می نمایند.
ابزارهای تألیف ، به منظور ایجاد و ویرایش متن و تصویر، روشهای آسانی را پیشنهاد می کنند که روش برخورد کاربر با پروژه را تعیین می نماید. معمولا اصوات و فیلمها با ابزارهای ویرایشی که مختص این رسانه ها هستند، ایجاد شده و سپس برای پخش، به سیستم های تألیف وارد می شوند. به مجموعه آنچه گفته می شود و چگونگی نمایش آنها به بیننده، رابط کاربر گویند. در رابط کاربر ، این مورد اهمیت فراوان دارد : یکی این که چه اتفاقی برروی ورودیها ی کاربر می افتد و دیگر این که گرافیک نمایش داده شده بر صفحه ، چگونه باشد. به سخت افزار و نرم افزاری که این محدودیتها را تعیین می کند چند رسانه ای پایه یا محیطی گویند.
موارد استفاده چند رسانه ای
چند رسانه ای هنگامی مناسب است که رابط کاربر آن ، استفاده کنندگان را به اطلاعات الکترونیکی متصل کند. چند رسانه ای ، قابلیت حفظ و نگهداری اطلاعات را افزایش می دهد و در بازار یابی فروش ، آموزش و پایگاههای Web نیز کاربرد دارد. نمونه ای از این کاربردها در زیر شرح داده می شود.

چند رسانه ای در تجارت
نمایشها ، آموزش، داد و ستد ( در بازار فروش )، آهی ، تشکیل گروههای مردمی ، پایگاه داده ها ، کاتالوگها و ارتباطات شبکه ای از کاربردهای تجارت چند رسانه ای است. بر بسیاری از شبکه های محلی و گسترده ( LAN ها و WAN ها ) پست آوایی و کنفرانس ویدیویی وجود دارد.
اکنون زمان اسلایدهای ۳۵ میلیمتری و نمایش بر پرده به پایان رسیده است. چند رسانه ای در امر آموزش ، گستره ی وسیعی پیدا کرده است. به عنوان مثال ، مراقبین پرواز می توانند در یک شبیه سازی ، اصول بین المللی را فرا می گیرد.

مانیتورهایی با تفکیک پذیری بالا ، همراه یک دوربین ویدئویی ، میکروفن و بلند گوهای استریو برای ساخت مشخصات کارمندی ، یادداشت های ویدئویی کنفرانسهای همزمان از راه دور استفاده می شوند. کامپیوترهای قابل حمل ، برای ارائه پروژه های چند رسانه ای ، مجهز به سریعترین پردازنده ها و گرداننده CD – ROM هستند.
چند رسانه ای در مدرسه

در طول چند سال آینده ، چند رسانه ای در فرایند آموزش تغییرات اساسی بوجود خواهد آورد.
به ویژه دانش آموزان مستعد ، از محدودیت های روش های آموزشی قدیمی ، فراتر می روند. در واقع معلمان راهنماهای مسیر تعلیم و دانش آموزان هسته اصلی فرایند آموزش و پرورش می باشند. این موضوع در امر تعلیم بسیار حساس است ، بنابراین ، نباید نرم افزارهای آموزشی ، جانشین ثابت روش های قدیمی باشند. بلکه تنها فرایند مؤثری در تکامل فرایند آموزشی خواهند بود.
دانشجویان و دانش پژوهان نیز درامر آموزش از چند رسانه ای استفاده می کنند. به عنوان مثال ، به منظور شناخت قلب ، ابزار آموزش الکترونیکی پیشرفته ای طراحی شود که بیش از صد حالت نمایشی برای پزشکان فراهم می کند و با استفاده از تصاویر قلب ، تکنیک طبی جدیدی را به دانشجویان کاردیولوژی ، رادیو لوژی و پزشکی می آموزد.
چند رسانه ای در خانه

سرانجام بیشتر پروژه های چند رسانه ای از طریق دستگاههای تلویزیونی و مانیتورها به خانه ها وارد می شوند و کاربران می توانند به صورت محاوره ای به آنها ارتباط برقرار کنند. امروزه ، مشتریان خانگی چند رسانه ای هم ، دارای یک دستگاه کامپیوتر و گرداننده ی CD – ROM هستند.
چند رسانه ای در مکانهای عمومی

در مکانهای عمومی ، مانند ایستگاههای قطار ، فروشگاهها ، موزه ها و مغازه ها و… برای اطلاع رسانی و راهنمایی از چند رسانه ای استفاده می کنند. نصب سیستم های چند رسانه ای ، نیاز به اتاقکهای قدیمی اطلاعات و پرسنل ها را کاهش می دهد.
فشرده سازی چیست ؟

تاکنون باید مشخص شده باشد که انتقال اطلاعات چند رسانه ای به صورت غیر فشرده کاملا از بحث خارج است. فشرده سازی با کیفیت بالایی امکان پذیر است. خوشبختانه ، در چند دهه گذشته ، محققین ، تکنیکها و الگوریتم های زیاد را برای فشرده سازی پیاده کردند که انتقال چند رسانه ای را امکان پذیر ساخت.
تمام سیستم های فشرده سازی به دو الگوریتم نیاز دارند : یکی فشرده سازی داده ها در منبع ، و یکی برای تجزیه آنها در مقصد. این الگوریتم ها را الگوریتم های رمز گذاری و رمز گشایی می نامند.

این الگوریتم ها دارای چندین حالت عدم تقارن اند که باید به آنها توجه شود. اول اینکه ، برای بسیاری از کاربرد ها ، سند چند رسانه ای مثل فیلم ، فقط یک بار رمز گذاری می شود ( وقتی کارگزار چند رسانه ای ذخیره می گردد ) ، اما هزاران بار رمز گشایی می شود ( وقتی که مشتریان آن را تماشا می کنند ). معنای این عدم تقارن این است که برای الگوریتم رمز گذاری قابل قبول است که کند بوده و نیازمند سخت افزار گرانی باشد ، به شرطی که الگوریتم رمز گشایی سریع بوده و نیاز به سخت افزار گران نداشته باشد امکان دارد کارگزار چند رسانه ای بخواهد سوپر کامپیوتر موازی ای را برای مدتی اجاره کند تا تمام کتابخانه های تصویری را رمز گذاری نماید ، اما اگر مشتریان به مدت دو ساعت سوپر کامپیوتر را اجاره نمایند تا تصویری را مشاهده کنند ، موفقیت آمیز نیست. بسیاری از سیستم های فشرده سازی عملی ، نیازمند زمان زیادی اند تا رمز گذاری را ساده و سریع انجام دهند ، حتی اگر به قیمت رمز گذاری تند و پیچیده تمام شود.

از طرف دیگر ، برای چند رسانه ای بلا درنگ، مثل کنفرانس ویدیویی، رمز گذاری کند مورد قبول نیست. رمز گذاری باید فوراً انجام شود. در نتیجه ، چند رسانه ای بلا درنگ، از الگوریتم یا پارامترهای متفاوت از الگوریتم های ذخیره سازی تصاویر بر روی دیسک ( اغلب با فشرده سازی کم ) استفاده می کند.
عدم تقارن این است که لازم نیست فرایند رمز گذاری/ رمز گشایی ، وارون پذیر باشد. یعنی ، هنگام فشرده سازی فایل ، انتقال آن ، و سپس تجزیه آن ، کاربر انتظار داشته باشد که به حالت اول برگردد ( دقیقا تا آخرین بیت ). این خواسته در چند رسانه ای وجود ندارد. اگر نتیجه رمز گشایی با متن اولیه تا حدودی متفاوت باشد. قابل قبول است وقتی خروجی رمز گشایی دقیقا با ورودی اولیه یکسان نباشد ، می گویند ، سیستم پر تلفات است.
اگر ورودی و خروجی یکسان باشد ، سیستم بدون تلفات است. سیستم های پر تلفات ، مهم هستند ، زیرا پذیرش تلفات اندکی از اطلاعات ، بسته به نسبت فشرده سازی ممکن منفعت زیادی دارد.

الگوریتم های فشرده سازی
رمز گذاری آنتروپی
الگوهای رمزگذاری به دو دسته تقسیم می شود: رمز گذاری آنتروپی و رمز گذاری منبع. هر کدام از این دو دسته را مورد مطالعه قرار می دهیم و تشریح می کنیم.
اولین مثال رمز گذاری آنتروپی ، رمز گذاری طول دنباله است. در بسیاری از انواع داده ها ، رشته ای از نمادهای تکراری ( بیتها , اعداد و غیره )، متداول است. اینها را می توان با علامت خاصی که در داده ها یافت نمی شود ، خود نما و تعداد دفعات تکرار آن مشخص کرد. اگر خود این علامت نیز در داده ها یافت شود ، تکراری است. به عنوان مثال ، رشته ای از ارقام دهی را که در زیر آمده است در نظر بگیرید

۳۵۰۰۰۰۰۰۰۰۰۰۰۰۸۴۵۸۷۱۱۱۱۱۱۱۱۱۱۱۱۶۳۵۴۶۷۴۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۰۶۵
اگر A را به عنوان نشانگر معرفی کنیم و از اعداد دو رقمی برای شمارش تکرار استفاده کنیم ، رشته فوق به صورت زیر رمز گذاری می شود :
۳۱۵A01284587A113116354674A02265
در اینجا ، رمز گذاری طول دنباله، طول رشته را به نصف تقلیل داد.
دنباله ها در چند رسانه ای نیز متداول است. در صوت، سکوت معمولاً با دنباله های صفر نشان داده می شود. در تصویر، دنباله های یکرنگ، در آسمان، دیوار یا سطوح صاف دیگر اتفاق می افتد.

مثال دوم در مورد رمز گذاری آنتروپی ، رمز گذاری آماری است. در این روش از کد کوتاه برای نمایش نمادهای متداول و از کد بلند برای نمایش نمادهای غیر تکراری استفاده می شوند. کد مورث از این قاعده پیروی می کند ، به طوری که E با ۰ شروع می شود و Q با – .- شروع می شود و ….. . رمز گذاری هافمن و الگریتم زیو- لمپل که توسط برنامه فشرده سازی یونیکس به کار می رود نیز از رمز گذاری آماری استفاده می نماید.

مثال سوم در مورد رمز گذاری آنتروپی سی ال یو تی ( CLUT ، جستجوی رنگ جدول ) نام دارد. تصویری را در نظر بگیرید که از رمز گذاری آر جی بی با سه بایت در پیکسل استفاده می کند. از نظر تئوری ، این تصویر باید ۲ بتوان ۲۴ مقدار رنگ مختلف داشته باشد. فرض کنید فقط ۲۵۶ رنگ مورد استفاده قرار می گیرد. فشرده سازی با ضریب ۳ ، با ساختن جدول ۷۶۸ بایتی که مقادیر آر جی بی مربوط به ۲۵۶ رنگ به کار رفته را لیست می کند ، و سپس نمایش هر پیکسل توسط شاخصی از مقدار آر جی بی در جدول انجام می شود. در اینجا مثال ساده ای را می بینیم که در آن رمز گذاری کندتر از رمز گشایی است ، زیرا رمز گذاری مستلزم جستجو جدول است در حالی که رمز گشایی با یک عمل شاخص بندی انجام می گیرد.
رمز گذاری منبع

رمز گذاری منبع با استفاده از امتیاز خواص داده ها ، فشرده سازی بیشتری ( معمولا پر تلفات ) را تولید می کند. در این جا نیز با سه مثال به شرح آن می پردازیم. مثال اول ، رمز گذاری تفاضلی است که در شماره های تلفات تصادفی که توسط کامپیوتر تولید شده و بازار یاب راه دور برای اذیت کردن مردم هنگام صرف شام ، از آن استفاده می کند، فاقد این ویژگی است. تعداد بیت های لازم برای نمایش تفاضل های بین شماره های تلفن متوالی موجود در لیست ، برابر با تعداد بیت های لازم برای نمایش خود شماره ها است. مثال دوم راجع به رمز گذاری منبع ، تبدیلات است. با تبدیل سیگنال ها از دامنه ای به دامنه ای دیگر، فشرده سازی ساده تر می گردد. به عنوان مثال ، تبدیل فوریه شکل ۱-۱ را در نظر بگیرید. در این جا ، تابه ای از زمان به صورت لیستی از دامنه ها نمایش داده می شود. با تعیین دقیق مقادیر تمام دامنه ها ، تابع اولیه به طور کامل باز سازی می شود. به هر حال ، با معلوم بودن مقادیر ( مثلا ) ۸ دامنه اول که با دو مرتبه اعشار گرد شده باشد ، امکان دارد سیگنال طوری بازسازی شود.

شكل (۱-۱) (b) مقادير پيكسل مربوط به بخشي از تصوير

تبديلي كه در آن عنصر بالاي سمت چپ از تمام عناصر به جز خودش كسر مي‌گردد

که شنونده نتواند تشخیص دهد که اطلاعاتی از بین رفته است. امتیازش این است که تعداد بیتهای لازم برای انتقال هشت دامنه ، کمتر از انتقال شکل موج نمونه سازی شده است.
تبدیلات در داده های تصویر دو بعدی نیز امکان پذیر است. فرض کنید، ماتریس ۴×۴ در شکل بالا ( a ) مقادیر مقیاس معمولی تصویر تک رنگ را نشان می دهد. این داده ها را می توان با کسر مقدار موجود در گوشه بالای سمت چپ از تمام عناصر ( به جز خودش ) ، تبدیل کرد (b). اگر از رمز گذاری با طول متغیر استفاده شود، این تبدیل می تواند مفید گردد. به عنوان مثال ، مقادیر بین ۷- و ۷+ را می توان با اعداد ۴ بیتی رمز گذاری کرد و مقادیر بین ۰ تا ۲۵۵ را می توان به صورت کد ۴ بیتی خاص ( ۸- ) که به دنبالش ، عدد ۸ بیتی می آید، رمز گذاری کرد.

گرچه این تبدیل ساده، بدون تلفات است ، بهتر از آن وجود ندارد. یک فضائی دو بعدی مهم دی تی سی ( DTC ، تبدیل کسینوسی مجزا ) نام دارد ( نیکو واینو گراد ، ۱۹۹۲ ). ویژگی این تبدیل این است که برای تصاویر فاقد انفصال دقیق ، بیشترین قدرت بینایی ، در چند عبارت اول است و موجب می شود تا از عبارت بعدی ، بدون از بین رفتن اطلاعات بیشتر، صرف نظر کرد.

سومین مثال رمز گذاری منبع ، کمّی کردن بردار است و در داده های تصویری قابل استفاده است. در اینجا، تصویر به مستطیلهایی با اندازه ثابت تقسیم می شود. علاوه بر خود تصویر ، نیاز به جدولی از مستطیلهای تصویر ( که احتمالا از تصویر ساخته شده اند ) دارد. این جدول، کتاب رمز نام دارد. برای انتقال هر مستطیل، در کتاب رمز جستجو می گردد و اندیس به جای مستطیل ارسال می شود. اگر کتاب رمز به طور پویا نیز ایجاد شود ( یعنی در تصویر ) ، باید منتقل گردد. بدیهی است که اگر تعداد اندکی از مستطیلها ، تصویر را تحت الشعاع خود قرار دهد ، در پهنای باند صرفه جویی می گردد. مثالی از کمّی بودن بردار در شکل ۲-۱ آمده است. در شکل ( a ) 2-1 مشبکی از مستطیلهایی با اندازه نامعلوم وجود دارد. در شکل ( b ) 2-1 کتاب روز نشان داده شده اشت. رشته خروجی لیستی از اعداد صحیح ۰۰۱۰۲۲۰۳۲۲۰۰۴۰۰ است که در شکل ( c ) 2-1 آمده است هر کدام ، یک کتاب از عنصر رمز را نشان می دهد.

شكل ۲-۱ مثالي از كمي كردن بردار . (A) تصوير به چند مربع تقسيم شده است . (B) كتاب رمز تصوير .
© تصوير رمز گذاري شده .

در واقع ، کمّی کردن بردار ، عمومیت دادن سی ال یو تی دو بعدی است. تفاوت آنها در حالتی است که انطباقی صورت نگیرد. در این صورت سه استراتژی امکان دارد. استراتژی اول ، استفاده از بهترین انطباق است. استراتژی دوم استفاده از بهترین انطباق و افزودن اطلاعاتی راجع به چگونگی بهبود انطباق است ( مثل ، افزودن مقدار میانگین مناسب ). سومین استراتژی استفاده از بهترین انطباق و افزودن آنچه که منجر به باز سازی دقیق داده ها می شود ، است دو استراتژی اول ، پر تلفات است ولی فشردگی زیادی را ایجاد می کند. استراتژی سوم بدون تلفات است اما به عنوان الگوریتم فشرده سازی ، به خوبی عمل نمی کند. مشاهده می شود که رمز گذاری ( انطباق الگو ) بیش از رمز گشایی ( شاخص بندی در جدول ) ، وقت صرف می کند.

خلاصه فصل اول
چند رسانه ای مورد استفاده بازرگانانی است که می خواهند مستندات ، واژه پردازها ، همراه صدا ، تصویر و ویدیویی و تصاویر گرافیکی عرضه کنند.
چند رسانه ای برای شروع کار و سرمایه گذاری در سخت افزار و نرم افزار و فراگیری ابزارهای جدید بسیار مناسب است. چند رسانه ای ترکیبی از متن ، گرافیک ، صوت و انیمیشن و ویدیو است.
چند رسانه ای در تجارت ، مدرسه ، خانه و در مکانهای عمومی مورد استفاده قرار می گیرد.
فشرده سازی انتقال اطلاعات چند رسانه ای به صورت غیر فشرده کاملا از بحث خارج است. فشرده سازی با کیفیت بالایی امکان پذیر است. تمام سیستم های فشرده سازی به دو الگوریتم نیاز دارد: یکی برای فشرده سازی داده ها در منبع و یکی برای تجزیه آنها در مقصد که این الگوریتم ها را الگوریتم های رمز گذاری و رمز گشایی می نامند.
الگوریتم های رمز گذاری به دو دسته تقسیم می شود : رمزگذاری آنتروپی و رمز گذاری منبع هر کدام از این دو دسته را مورد مطالعه قرار دادیم.

فصل ۲

در این فصل می خوانید :
• قدرت صوت
• فرمت فایل های صوت
• صوت در سیستم چند رسانه ای
• صداهای MIDI در مقایسه با صداهای دیجیتال
• صوت دیجیتال
• اندازه ی فایل در برابر کیفیت
• فضای ذخیره سازی

صوت
موج صوت ( صدا ) ، موج اکوستیک یک بعدی است. وقتی موج اکوستیک وارد گوش می شود، پرده گوش مرتعش می گردد و موجب می شود تا استخوان های کوچک گوش داخلی ارتعاش کند، و پالس های عصبی را به مغز ارسال نماید. در این پالس ها به صورت صدا تلقی می شود به همین روش وقتی موج آکوستیک به میکروفون برخورد می کند، میکروفون سیگنال الکتریکی تولید می نماید که دامنه صدا را به صورت تابعی از زمان نشان می دهد. نمایش، پردازش، ذخیره و انتقال این سیگنال های صوتی بخش عمده مطالعه سیستم های چند رسانه ای است.
دامنه فرکانس گوش انسان از ۲۰Hz تا ۲۰۰۰۰Hz است؛ گرچه بعضی از حیوانات ، به خصوص سگها ، فرکانسهای بالا را می شنوند. گوش به طور لگاریتمی می شنود ، لذا نسبت دو صدا با دامنه های A وB بر حسب db ( دسیبل ) سنجیده می شوند؛ به صورت فرمول زیر :
Db = 20log210( A / B )

اگر حد پایین شنیداری ( فشاری در حدود ۰/۰۰۰۳ dyne/cm ) را برای موج سینوسی ۱-khz ، ۰dB تعریف کنیم ، مکالمه معمولی برابر با ۵۰dB و آستانه درد تقریبا ۱۲۰dB است. ( دامنه پویایی از ضریب ۱۰۰۰۰۰۰ ). برای رفع ابهام باید گفت که A وB که در بالا ذکر شد دامنه اند.

اگر از سطح توان که متناسب با مربع دامنه است استفاده شود ، ضریب لگاریتم برابر با ۱۰ خواهد شد.
گوش، به تغییرات صدا بسیار حساس است پس از چند میلی ثانیه به آن پی میبرد و بالعکس، چشم، تغییرات در سطح نور را که فقط چند ثانیه طول بکشد درک نمی کند. نتیجه این مشاهده این است که تاخیر لرزش چند میلی ثانیه ای در اثنای انتقال چند رسانه ای، در کیفیت صدای دریافت شده بیشتر از تاخیر آن در کیفیت تصویر دریافتی است.
امواج صوتی را می توان با ای سی دی ( ACD ، مبدل دیجیتال به آنالوگ ) به شکل دیجیتال در آورد.

ای سی دی ولتاژ الکتریکی را به عنوان ورودی گرفته و عدد دو دو یی را به عنوان خروجی تولید می نماید.در شکل ( a ) 1-2 نمونه ای از موج سینوسی دیده می شود. برای نمایش دیجیتالی این سیگنال ، آنرا در هر دلتا ثانیه نمونه سازی می کنیم شکل ( b ) 1-2. اگر موج صدا، موج سینوسی خالص نباشد، اما استقرا خطی امواج سینوسی خالص نباشد، اما استقرا خطی امواج سینوسی ، که در آنجا بالاترین قطعه فرکانس وجود دارد. F باشد نظریه نایکویست می گوید که نمونه برداری در فرکانس ۲f کافی خواهد بود.

نمونه برداری از هیچ مقدار صورت نمی گیرد، زیرا از فرکانس های بالاتری که چنین نمونه برداری بتواند تشخیص دهد ، وجود ندارد نمونه های دیجیتال دقیق نیست. نمونه های ۳
بیتی شکل © ۱-۲ فقط هشت مقدار را نشان می دهد ، از جمله -۱/۰۰ تا +۱/۰۰و با گام ۲۵/۰ نمونه ۸ بیتی ، ۲۵۶ مقدار را نشان می دهد. نمونه ۱۶ بیتی ، ۶۵۵۳۶ مقدار را نشان می دهد.

خطایی که در اثر تعداد بیتها در هر نمونه ایجاد می شود ، کمّی کردن اختلال نام دارد. اگر بسیار بزرگ باشد ، گوش آن را تشخیص میدهد.
دو مثال متداول از صدای نمونه سازی شده ، تلفن و دیسکهای فشرده صوتی است. مدوله کردن کد پالس که در سیم تلفن به کار می رود ، در هر ثانیه ۸۰۰ بار از نمونه های ۷ بیتی ( آمریکای شمالی و ژاپن ) یا ۸ بیتی ( اروپا ) استفاده می کند. سرعت داده ها در این سیستم b 5600 یا b 6400 است. فقط با ۸۰۰۰ نمونه در ثانیه ، فرکانس های بالاتر از khz 4 مفقود می شود.

شكل ۱-۲ : (a) موج سينوسي . (b) نمونه سازي موج سينوسي . (c) كمي كردن ۳ بيتي نمونه‌ها

سی دی های صوتی با نمونه سازی سرعت ۴۴۱۰۰ نمونه بر ثانیه ، دیجیتال شده است. این سرعت برای بدست آوردن فرکانسهای تا HZ 22050 کافی است ، این فرکانس برای انسان خوب نسیت ولی برای سگ خوب است. نمونه ها ۱۶ بیتی اند و بازه دامنه به صورت خطی اند. باید توجه داشت که نمونه های ۱۶ بیتی فقط ۶۵۵۳۶ مقدار را ممکن می سازد ، گرچه بازه پویای گوش ، در مقایسه با کوچکترین صوت قابل شنیدن ، تقریبا یک میلیون است لذا استفاده از ۱۶ بیت در هر، کمی کردن اختلال را عرضه می کند ( گرچه کل بازه پویا تحت پوشش قرار نمی گیرد- فرض می شود که سی دی ها صدمه نمی بینند ). با ۴۲ ، ۱۰۰ نمونه ۱۶ بیتی در هر ثانیه ، سی دی برای منو ( در مقابل استریو ) به پهنای باند kbps 6/705 و برای استریو به پهنای باند Mbps 411/1 نیاز دارد. با اینکه کمتر از نیاز تصویر است ، کانال تی ۱ کاملی را برای انتقال صوت استریو با کیفیت سی دی غیر فشرده ، اشغال می کند.
صدای دیجیتال شده را نرم افزار کامپیوتر می تواند پردازش کند. چندین برنامه برای کامپیوترهای شخصی وجود دارد که کاربر می تواند با استفاده از آنها ، امواج صوتی را از منابع مختلفی ضبط کند،نمايش دهد،ميکس کند و ذخيره نمايد.امروزه ضبط کردن و تغيير صدا به صورت ديجيتال انجام می شود.

بسیاری از ابزار موسيقی دارای رابط ديجيتال هستند. وقتی تجهيزات ديجيتال کشف شد،هر کدام،رابط مخصوص به خودش را داشت،اما پس از چندی استاندارد ام آی دی آی(MIDI،رابط ديجيتال ابزار موسيقی ) ايجاد شد و تمام صنايع موسيقی آن را پذيرفتند.اين استاندارد ، رابط کابل وقاب پيام را مشخص می کند . هر پيام ام آی دی آی متشکل از بايت وضعيت صفر و يا چند بايت اطلاعات است . هر پيام ام آی دی آی ، واقعه مهم موسيقی را حل مي کند . معمولا وقايع ، فشار دادن کليد ، انتقال کليد کشويی، يا پدال پا است. بايت وضعيت، واقعه را مشخص می کند، و بايتهای داده شد و سرعت انتقال آن .

به هر وسيله موسيقی کد ام آی دی آی خاصی نسبت داده میشود . به عنوان مثال ، پيانوی بزرگ برابر با ۰ ، ماريمبا برابر با ۱۲ و ويولون برابر با ۴۰ است ، اين کار لازم است تا کنسرت فلوت مثل کنسرت شيپور نواخته نشود. تعداد ۱۲۷ ابزار موسيقی تعریف شده است ، اما بعضی از اينها ابزار نيستند ، بلکه اثراتی مثل جيک جيک پرندگان ، هليکوپتر ، و جنجالی که توسط برنامه های تلويزيونی ايجاد می شود، است.

قلب هر سيستم ام آی دی آی ، تلفيق کننده (اغلب يک کامپيوتر )است که پيام ها را می پذيرد . واز آنها موسيقی توليد می کند. تلفيق کننده هر ۱۲۷ ابزار را می شناسد ، لذا طيف قدرت مختلفی را برای c ميانی ، در شيپور ايجاد می نمايد (به جای ايجاد اين طيف در سنتور). امتياز انتقال موسيقی به کمک ام آی دی آی در مقايسه با ارسال موج های ديجيتال شده ، کاهش پهنای باند است ، این کاهش گاهی با ضريب۱۰۰۰ خواهد بود. عيب ام آی دی آی اين است که گيرنده برای مونتاژ مجدد موسيقی ،نياز به تلفيق کننده دارد ، هر تلفيق کننده اجرای خاصی از موسيقی را ارائه می کند.

البته موسيقی ، حالت خاص و مهمی از صوت است ، حالت مهم ديگر گفتار است، گفتار انسان در بازه HZ 600 تا HZ 6000 است. گفتار از حروف صدا دار و صامت ايجاد می شود، که دارای خواص متفاوتی اند.اصوات وقتی ايجاد می شود که ناحیه صوتی مسدود نباشد، يعنی طنينی توليد شود که فرکانس اصلی آن به اندازه و شکل سيستم صوتی و وضعيت زبان و فک صحبت کننده بستگی دارد . اين صداها تقريباً برای فاصله زمانی ۳۰ ميلی ثانيه ای به صورت دوره ای هستند . طنين وقتی ايجاد می شود که ناحیه صوتی نسبتا بسته باشد. اين صداها نظم کمتری نسبت به حروف صدا دار دارند . فرمت فايلهای صوتی هنگام ايجاد سيستم چند رسانه ای ، با قابها و مترجم های متن ، صدا، تصوير، انيميشن يا ويدئو کليپهای ديجيتال ، سر و کار خواهيم داشت . فرمت يک فايل صوتی ، روش و متدولوژی شناخته شده ای جهت سازمان دادن بيتها و بايتها مربوط به داده های صوتی ديجيتايز شده در یک فايل داده ای است . البته برای آنکه داده های صوتی بتوانند در يک کامپيوتر ذخيره ، ويرايش يا پخش شوند بايد ساختار فايل شناخته شود.

اصوات ديجيتایز شده در مکينتاش ، ممکن است به شکل فايل داده ای ( به عنوان مثال با پسوند ALF . يا SDII ) ذخيره شده باشند و يا به عنوان منابع در انشعاب System يا program application به شکل SND ذخيره شده باشند. مکينتاش يک ساختار فايل دو شاخه را بکار می برد و بايد مشخص شود که فايل مورد نظر در يک انشعاب منبع قرار دارد يا به شکل فايل مجزا است.

در ویندوز اصوات دیجیتاز شده معمولاً به صورت Wave در فایل ها یی با پسوند WAV ذخیره می شوند. از آن جا که شرکت ها روش هایی برای به جریان انداختن و پخش صوت از روی WWW ارائه داده هستند، فرمت های جدیدی برای شبکه ی Internet پدید آمده است.

در نخستين روزهای internet ، فرمت متداول برای اصوات AU بود (فرمت بين المللی ارتباطات تلفنی (۷۱۱GCCITT ) uLaw که به law-Mu يا فرمت TalkRadio يا Geek if the Week ملقب است و بدین شکل تلفظ می شود : (law-mew) در اين فرمت سرعت نمونه برداری ،KHz8 و به روش ۸ بيت مونو مب باشد. امروزه فرمت uLaw، سرعت ۱۶ بيت KHz8 و با قدرت فشرده سازی ۲:۱ پشتيبانی می کند .aLaw معادل اروپايی uLaw ، می باشد. برای فايل های صوتی مکينتاش ، زمانی که داده های صوتی تماما” در انشعاب داده ها (fork data) قرار دارند ، فرمت AIFF ترجيح داده می شود. (اين فرمت ها چنانچه طرحهای فشرده سازی MASE به شکل ۳:۱ و ۶:۱ را پشتيبانی کند ، AIFC خوانده می شود) فرمت wave با ابداع ويندوز ، توسط Microsoft وIBM مطرح و مرسوم شد.

روشهای زيادی برای ذخيره سازی بيتها و بايتها ، جهت تشريح شکل موجهای صوتی نمونه برداری شده وجود دارد . روشی که برای فايلهای دادهای صوتی Book Red روی CDهای موزيک به کار می رود
Liner pulde code Modulation است .فرمت I-CD
(که به عنوان نوعی ديگری از استاندارد Book Read توسط Philips توسعه داده شده است)،برای ارائه دو ساعت موزيک استريو با کيفيت بالا يا ۲۰ ساعت صوت مونو با کيفيت صدای معمولی روی هر CD از روش ADPCM استفاده می کند چنانچه بخواهيد داده های صوتی ADPCM را در لا بلای صفحات تصاوير گرافيکی يا ويدئويی بگنجانيد ، فرمت I-CD امکان همزمان کردن صوت و تصوير را بدون نياز به Buffering data فراهم می آورد در اين صورت نياز به يک ROM CD مخصوص با معماری پيشرفته (XA CDROM ) خواهد بود مکينتاش و ويندوز می تواند از فايل MIDI استفاده کنند . رابط MIDI روی PC ها به صورت برد های صدا ساخته می شود که برای کامپيوتر های MPC يک نياز محسوب می شود. در مکينتاش برای ورودی و خروجی تجهيزات MIDI يک آداپتور لازم است در دو سيستم (مکينتاش و ويندوز ) اصوات DIDI معمولا در فايل هايی با پسوند MID ،ذخيره می شود.

قدرت صوت
هر گاه شی در هوا ، ارتعاش کند ، امواجی ايجاد می کند .این امواج مانند ، امواج آب ناشی از پرتاب سنگ در يک آبگير آرام ، در هوا پخش می شود . و زمانی که به پرده گوش می رسند تغييرات فشار يا ارتعاشات به صورت صوت دريافت می شود . اين امواج با سرعت ۷۵۰ مايل در ساعت در هوا منتشر می شود. امواج صوتی ار نظر دامنه نوسانات ، فرکانس یا زير و بمی صدا (يعنی تعداد ارتعاشات در ثانيه که با واحد هرتز يا HZ اندازه گيری می شود )با يکديگر تفاوت دارند . بسياری از امواج صوتی از امواج يک موسيقی موزون گرفته تا يک گفتار يا

يک طنين ساده ، می توانند با يکديگر ترکيب شوند. آکوستيکس (Acoustics) ، علم صوت شناسی است سطوح فشار صوت (يعنی بلندی يا درجه صدا ، volume ) با واحد دسی بل (dB) ، اندازه گيری می شود .در واقع دسی بل ، نسبت بين يک نقطه مرجع انتخابی روی يک مقياس لگاريتمی و سطحی است که واقعاً شنيده می شود . وقتی توان خروجی صوت ۴ برابر شود ميزان افزايش تنها dB6 است . زمانی که صوت ۱۰۰ برابر تقويت می شود ، ميزان افزايش ، تنها dB20 است.

صوت، انرژی است . صدای بلند، می تواند به اعضای حساس گيرنده صوت که پشت پرده گوش هستند ، آسيب وارد کند. درک تن صدا ، به فرکانس صدا وابسته است : در فرکانس های پايين ، برای اينکه همان بلندی که در اصوات با فرکانس های متوسط يا بالا تر درک می شود ، منتقل گردد ، نياز به توان بالاتر است شايد بيش از آنکه صوت را بشنوید آن را احساس کنيد.

علم صوت شناسی ، علاوه بر دزجه (volume) و دانگ (Pitch) صدا ، موارد ديگری را نيز در بر می گيرد اگر مطالعه بيشتری در اين مورد انجام شود می توان به پرسش هايی از اين قبيل پاسخ داد : چرا صدای نت در يک اکتاو روی يک ويلون سل بر روی يک قره نی متفاوت است؟ چرا يک کودک ۵ ساله صدايی با فرکانس Hz 100 را که در dB 20 پخش می شود ، می شنود در حالی که فرد بالغ در اثر فقدان حساسيت شنوايی (که به سن انسان بستگی دارد ) نمی تواند اين گونه اصوات را بشنود ؟ برای استفاده از صوت از پروژه های چند رسانه ای به دانش تخصصی در مورد هارمونی ها ، وقفه ها ، امواج سينوسی ، نت سازی اکتاو ها (نت های ۷ گانه موسيقی) يا فيزيک صوت شناسی و ارتعاش ، نيازی نيست . ولی در موارد زير

، آگاهی داشت :
• چگونگی ايجاد صدا
• چگونگی ضبط و تغيير و تنظيم صدا
• چگونگی پيوند دادن صدا به سيستم مورد نظر

 

صوت در سيستم چند رسانه ای
صوت روی کامپيوتر های شخصی چند رسانه ای با سيستم عامل ويندوز مکينتاش به خوبی اجرا می شود . زيرا بلافاصله پس از نصب سيستم عامل ، علائم صوتی هشدار دهنده سيستم ، نظير بوق ها و ساير علائم دسترس خواهند بود.
در ويندوز ، صدا های سيستم به صورت فايلهايی با پسوند WAV ، وجود دارند . صدا ها در ويندوز ۹۵ ، در زير فهرست Media/Win قرار دارند . می توان اين اصوات را به وقايع سيستم نظير آغاز کار ويندور ،علائم اخطار ناشی از ساير برنامه های کاربردی يا فشردن دکمه ماوس خارج از پنجره گفتگو (که باعث توليد صدای بوق از پيش تعيين شده می گردد)نسبت داد . (شکل ۲-۲ ) طرحی از اصوات را می توان ايجاد کرد و طرحی خاص را مطابق وضعيت موجود ، انتخاب کرد . فايل های صوتی ايجاد شده با پسوند WAV در زير فهرست Media/Win قرار می گيرند . به این ترتيب ، نصب و به سيستم اضافه خواهند شد و با panel control می توان آنها را وقايع سيستم اختصاص داد .

صدا های سيستم ، در پنجره ی محاوره ای صوت درpanel control ، تعيين شده و همان جا تست می گردند . راه اندازی صوت در ويندوز ، مستلزم وجود يک کارت صدا است که با راه اندازی های مناسب آن ، روی کامپيوتر PC نصب شده است . شکل ، panel control های صوت را در مکينتاش و ويندوز نمايش می دهد .
در برخی از مدل های مکينتاش ، با استفاده از۷ system ، يک ميکروفن و دستگاه ديجيتايز کننده صوت نظير Macrecoreder می توان صدا های سيستمی جديدی ضبط کرد دکمه Add در panel control صوت ،اين نرم افزار ضبط ، در۷ system ساخته می شود .

شكل ۲-۲ Cntrol Panel هاي در مكينتاش و ويندوز

صدا های MIDI در مقايسه با صداهای ديجيتال
MIDI به معنای رابط ديجيتال تجهيزات موسيقی ، استاندارد ارتباطات است که در اوايل دهه ۱۹۸۰ برای تجهيزات موسيقی الکترونيکی و کامپيوترها ارائه شد . اين استاندارد ، Synthesizbr های صدا و موسيقيهای مختلف را با ارسال پيام از قبيل کابلهايی که به دستگاها متصل است ، به يکديگر ارتباط می دهد . MIDI ، پروتکلی را برای پذيرش علامت های موسيقی ، نظير نت ها و آلتی که اين نت ها را می نوازد ، ارائه می کند . ولی داده MIDI ، صوت ديجيتايز شده نيست بلکه نمايش مختصر موسيقی است که به شکل عددی ذخيره شده است . صوت ديجيتال ، يک صدای ضبط شده و MIDI يک علامت است . صوت ديجيتال به قابليتها و توانييهای سيستم صوتی بستگی دارد ، MIDI ، علاوه بر توانييهای سيستم صوتی به کيفيت تجهيزات موسيقی نيز وابسته است .

يک فایل MIDI ، لیستی از فرمانهای صوتی است ، که زمان اجرای هر يک از آنها مشخص است و هر يک نشان دهنده يکی از عملیات موسيقی می باشد ( برای نمونه ، فشردن يک کلید پيانو يا نگه داشتن پدال ) . نتيجه اين فرمانها به دستگاه باز نواخت MIDI ، تولید صوت است . يک پيغام فشرده و مختصر MIDI می تواند باعث ايجاد يک صوت پيچيده يا مرکب يا ترتيب دادن اصوات برای نواخته شدن روی يک آلت موسيقی يا SYNTHESIZER شود . بنابر اين ، فايلهای MIDI کوچکتر از فايلهای موجی شکل دیجیتايز شده معادل خود می باشد .

در مقابل داده های MIDI ، داده های صوتی قرار دارند که نمایش واقعی يک صدا هستند و به صورت هزاران عدد منحصربه فرد(که نمونه نامیده می شوند) ذخیره شده اند. داده های دیجیتال دامنه نوسان (بلندی) يک صدا را در برش های زمانی مجزا نشان می دهد. زیرا این مورد وابسته به دستگاه نمی باشد ، هر زمان که صوت دیجیتال نواخته شود ، به همین صورت صدا تولید می کند . ولی این حجم داده ها پر هزینه هستند . زیرا فایل های بزرگی برای ذخيره سازی داده ها لازم است . بنابراین صوت دیجیتال روی CD های موسیقی ذخیره می شود .

موقعيت داده های MIDI در برابر داده های صوتی دیجیتال ، مانند موقعيت طرح های گرافيکی برداری يا ترسيمی ، در مقابل طرح های گرافيکی BITMAP می باشد . بدين معنا که داده ها MIDI وابسته به دستگاه هستند و داده ها دیجیتال وابسته نيستند .
همانگونه که نمايش طرح های گرافيکی برداری ، بسته به دستگاه چاپگر يا صفحه نمايش ، با هم متفاوتند ، اصواتی که توسط فايلهای موسيقی MIDI توليد می شوند نيز به دستگاه MIDI مخصوصی که برای پخش به کار می رود ، بستگی دارند . از سوی ديگر ، داده های ديجيتال با انتطباق کم يا زياد ، بدون توجه به سيستم پخش ، توليد صدا کرده و پخش می شوند . استاندارد MIDI ، مانند POSTSCRIPT است ، که به تجهيزات موسيقی اجازه می دهد با يک زبان قابل فهم با يکديگر ارتباط برقرار کنند .