هدف اصلي در اين مقاله به دست اوردن معادله بهينه بين خواص مهم كيفي نخ با عيوب نخ و خواص الياف در نخ كارد شده پنبه اي مي باشد براي اين كار از تجزيه و تحليل كامل رگرسيوني و استفاده از رگرسيون نيرومند و رگرسيون متعامد و نمودارهاي باقيمانده جزئي و تعيين انتخاب متغير به روش همه رگرسيون هاي ممكن و آماره Cp  مالوس همراه با نرم افزار SAS استفاده گرديده است. براي انجام اين كار از ۸۷ نمونه به دست آمده از نتايج آزمايشي مركز بين المللي نساجي آمريكا در تگزاس استفاده گرديده است. براي همه نخ ها از فاكتور تاب يكسان   استفاده شده و نمره نخل هاي ۱۵ تا۳۱ انگليسي توليد گرديده است، معادلات با تعداد متغيرهاي مناسب و محدود و همچنين ترتيب اهميت آنها، همراه با ضريب همبستگي بسيار خو به دست آمده است.

 
۱- مقدمه
خواص فيزيكي و مكانيكي الياف ومشخصه هاي مختلف كيفي نخ در رفتار فرآيندي، راندمان توليد و بالاخره نخ و پارچه تأثير عمده اي دارد. همچنين تغييرات مشخصه هاي مهم نخ شامل نمره تاب، استحكام، ازدياد طول و عيوب نخ مخصوص براي نخ هاي بريده شده (Stuple) غيرقابل اجتناب است اين تغييرات در خصوصيات نخ در طول فرآيند توليد و هم بعد از توليد، باعث مشكلات زيادي مي شود. بنابراين ارتباط بين اين مشخصات براي جلوگيري از مشكلات مختلف بايد به طور واضح مشخص گردد. همچنين پيشگويي مشخصه هاي مهم كيفي نخ (خواص كششي، پرز وCV% جرمي نخ) از خصوصيات مواد خام، هدف اصلي بسياري از محققين در دو دهه گذشته بوده است به طور كلي دو روش اصلي، روش هاي آماري و روش هاي تحليلي و تئوريكي در مطالعات گذشته مورد استفاده قرار گرفته است. يكي از روش هاي مهم استفاده از روش رگرسيون چندمتغيره بوده است و در اين مقاله سعي گرديده است اين ارتباط را به مشخصه هاي ديگر نخ از جمله عيوب نخ و تعداد الياف در سطح مقطع نخ نيز گسترش داده و سپس با بررسي كامل رگرسيون و استفاده از روش هاي آماري ديگر به نتايج دقيق تر و كاربردي تر به دست آيد.

 
۲- مروري بر مطالعات قبلي
تا كنون مدل هاي رياضي و تحليلي زيادي براي تخمين استحكام نخ تكي از مشخصه مختلف الياف و نخ به دست آمده است [۱و۲و۳و۴]. هول [۵] انواع مطالعات تجربي و رياضي در ارتباط با استحكام نخ را در بين سال هاي ۱۹۲۶ تا ۱۹۶۵ انجام داده است هانتر [۶] بيشتر از ۲۰۰ مقاله در مورد پيشگويي پارامترهاي كيفي نخ بخصوص خواص كششي تا سال ۲۰۰۴ منتشر كرده است.
مشخصه مهم ديگر نخ ازدياد طول تا حد پارگي است كه اين مشخصه نيز روي كارايي نخ‌ها، در دومين پيچي و بافندگي تأثير مي گذارد. ازدياد طول نخ نيز به خواص الياف، تاب نخ و نمره نخ بستگي دارد.
اگرچه تعداد مقالات در اين زمينه كمتر است ولي مدل هاي رياضي توسط اگروال [۷]، فردريچ [۳] و زرك [۸] پيشنهاد شده است. همچنين مدل هاي آماري توسط هانتر [۱] و مدل ANN توسط ماجمدر [۹] ارائه شده است.
نايكنواختي نيز فاكتور مهمي در مورد كيفيت نخ و پارچه مي باشد، تغييرات تعداد الياف در سطح مقطع نخ، دليل اصلي نايكنواختي است. علاوه بر اين پارامترهاي ماشين، روش ريسندگي، نمره نخ و بعضي مشخصه هاي الياف اثر مستقيمي روي نايكنواختي نخ دارند هانتر [۱] و اتريج و همكاران [۱۰] چند مدل را براي مشخص كردن نايكنواختي از مشخصه‌هاي الياف ارائه نموده اند.
– پرزدهي، يك مشخصه قابل اندازه گيري ديگري از نخ است كه عموماً يك خصوصيت نامطلوب است كه مقالات كمتري در مورد برآورد پرزدهي نخ با استفاده از مشخصه هاي الياف تاكنون ارائه گرديده است.
اخيرا كليك [۱۱] نيز مدل هاي مختلف رگرسيون چند متغيره خطي را براي تخمين استحكام نخ از مشخصه هاي ديگر نخ شامل قطر نخ، تغييرات قطر، تاب و تغييرات تاب، نايكنواختي جرمي و نايكنواختي نوري را با ضرايب همبستگي نسبتاً خوب به دست آورده است.
و بالاخره ارن و كادوگلا [۱۲] مدل هاي آماري براي برآورد خواص كششي، نايكنواخت و پرزدهي نخ از خواص مختلف الياف (اندازه گيري شده با دستگاهHVI) و خواص نيمچه نخ با استفاده از مدل هاي رگرسيون و چند متغيره ارائه نموده است.
با توجه به اينكه معادلات مختلفي در مورد خصوصيات نخ ارائه شده است كه گاهي نتايج حتي متضاد هم نيز مي باشند و همچنين اهميت هر كدام از آنها نيز در اين مقالات متفاوت مي باشد. در اين مقاله سعي شده است تجزيه و تحليل كامل آماري همراه با بررسي فرضيات مورد نظر و استفاده از روش هاي آماري مناسب و نرم افزار پيشرفته SAS، نتايج دقيق تر و كاربردي تر (معادلات بهينه) حاصل گردد. همچنين از مشخصه هاي ديگر نخ يعنيعيوب نخ (نقاط نازك- كلف و نپ) و تعداد الياف در سطح مقطع نيز جهت پيشگويي خصوصيات نخ استفاده گرديده است.

 
۳- تئوري [۱۳]
مدل رگرسيوني شامل بيش از يك متغير مستقل را چندگانه مي گويند. شكل ماتريسي آن به صورت ذيل مي باشد:
 
و با فرض اينكه جملات خطا يا باقيمانده داراي خواص زير باشند.
۱-  
۲- (ثابت)  
۳-   يعني مستقل باشند.
و برآورد ضرايب با استفاده از روش كمترين مربعات به صورت ذيل خواهد بود.
 
همچنين بايد، رابطه تقريبي خطي بين متغيرهاي مستقل و متغير وابسته وجود داشته باشد، در صورتي كه يك رابطه خطي وجود نداشته باشد معمولاً از تبديل متغيرها استفاده مي گردد تا به يك رابطه خطي تبديل گردند.
براي آزمون معني داري هر يك از ضرايب رگرسيوني از توزيعt استفاده مي شود. بايد توجه كرد كه در حقيقت اين يك آزمون جزئي يا حاشيه اي است زيرا ضرايب رگرسيوني   به كليه متغيرهاي رگرسيوني ديگر   كه در مدل حضور دارند بستگي دارد.
بنابراين آزمونt، سهم تأثير گذاري Xj به مدل، به شرط موجود بودن ديگر متغيرها در مدل مي باشد. اگر ستون هاي ماتريسX بر هم عمود باشند يعني ستون هاي متعامد درX وجود داشته باشد در اين صورت مي توان سهم تأثير متغيرهاي رگرسيوني را نسبت به مدل بدون هيچ شرطي (موجود بودن متغيرهاي ديگر در مدل) اندازه گيري نمود.
ضرايب رگرسيوني استاندارد شده
مقايسه مستقيم ضرايب رگرسيوني با واحدهاي مختلف معمولاً مشكل است زيرا بزرگي   واحد اندازه گيري متغير رگرسيونيXj را نمايان و مشخص مي كند. در حالت كلي واحدهاي ضريب رگرسيوني   عبارتند از واحدهايy تقسيم بر واحدهاي Xj است بدين علت گاهي كار كردن با متغيرهاي رگرسيوني و متغيرهاي پاسخ مقياس سازي شده كه ضرايب بدون بعد را توليد مي كنند كمك كننده است. در روش مقياس سازي معمول كه يكي از روش هاي مرسوم تر روش مقياس سازي طول واحد به شرح ذيل است.
                     
 
در اين مقياس سازي هر متغير جديد رگرسيوني Wj داراي ميانگين صفر و طول يك مي‌باشد.
ضرايب مدل جديد كه به صورت بدون عرض از مبدأ است را ضرايب رگرسيوني استاندارد شده مي گويند و گاهي به نام ضرايب بتا نيز گفته مي شود.
شاخص هاي رگرسيوني و معيارهاي مناسب مدل
ضريب تعيين چند متغيرهR2  به صورت ذيل تعريف مي گردد.
 
در موارد كاربردي از R2 تعديل شده كه به صورت ذيل استفاده مي گردد.

 
نمودارهاي باقيمانده ها
اين نمودارها نقش مهمي در قضاوت در مورد مناسب مدل سازي ايفا مي كنند.
نمودارهاي باقيمانده مفيد در رگرسيون چندگانه به شرح ذيل است:
الف- نمودار باقيمانده ها روي كاغذ احتمال نرمال
ب- نمودار باقيمانده ها در مقابل مقدار برازش شده  
ج- نمودار باقيمانده ها در مقابل هر يك از متغيرهاي رگرسيونيxj
اين نمودارها براي آشكارساز انحرافات از نرمال، نقاط دور افتاده، عدم تساوي واريانس و تخصيص تابعي غلط براي يك متغير رگرسيوني مورد استفاده قرار مي گيرند.

 
نمودارهاي باقيمانده هاي جزيي
اين نمودارها براي هر چه دقيق تر آشكار كردن ارتباط بين باقيمانده ها و متغيرهاي رگرسيونx¬I طراحي مي شوند و به صورت ذيل تعريف مي گردد.
 
نمودار e*ij در مقابلXij يك نمودار باقيمانده جزيي ناميده مي شود و به دليل اينكه ارتباط بينy و متغير رگرسيونيXj را پس از رفع تأثير ديگر متغيرهاي رگرسيوني   را نشان مي دهد. با وضوح بيشتر اثر xj¬ را روي پاسخy در حضور ديگر متغيرهاي رگرسيوني نشان مي دهد. بنابراين اين نمودارها جانشيني براي نمودارهايy در مقابلxj در رگرسيون چندگانه خواهد بود.
باقيمانده هاي Press
براي محاسبه Press يك مشاهده را انتخاب مي كنيم و مدل رگرسيوني را نسبت به n-1 مشاهده مانده برازش مي دهيم و   به دست مي آيد و خطاي پيش بيني براي نقطهi ام به صورت   به دست مي آيد و آماره Press به صورت مجموع مربعات به صورت ذيل تعريف مي گردد.

همچنين قابل ذكر ميباشد كه Press مي تواند به جايSSE براي محاسبه يك تقريبR2 براي پيش بيني مشاهدات جديد به صورت ذيل مورد استفاده قرار گيرد.
  پيش بيني
نقاط دورافتاده
دورافتاده ها بسته به موقعيتشان در فضايx مي توانند مدل رگرسيوني را متعادل يا به صورت شديد تحت تأثير قرار دهند بنابراين داده هاي دور افتاده بايستي به دقت مورد رسيدگي قرار گيرند. براي كشف و در صورت امكان حذف نقاط دور افتاده آزمون هاي آماري گوناگون پيشنهاد شده است.
لازم به ذكر است اين نقاط دور افتاده مي تواند بر برآوردگرهاي حداقل موهبات تأثير بگذارد. در تأثيرگذاري، دور افتاده ها، برازش حداقل مربعات را در حد زيادي به سمت خود مي كشند و در نتيجه تعيين و تشخيص اين دور افتاده ها مشكل مي شود. زيرا باقيمانده‌هاي مربوط به آنها به طور ساختگي و مصنوعي كوچك مي باشند مهارت زياد در تحليل باقيمانده اي و يا تكنيك هاي خاص براي مشاهدات تأثيرگذار مي تواند تحليل گر را در كشف اين مشكلات كمك كند.
هم خطي چندگانه
هم خطي چندگانه يا همبستگي خطي نزديك بين متغيرهاي رگرسيوني است اين هم خطي به صورت شديد مي تواند دقت برآورد ضرايب رگرسيون را تحت تأثير قرار دهد. در عمل هم خطي چندگانه شديد باعث متورم شدن واريانس هاي ضرايب رگرسيوني مي شود و احتمال علامت غلط ضرايب را افزايش مي دهد.
آماره VIF يا عامل تورم واريانس شاخص مهمي براي هم خطي چندگانه مي باشد.
به طور كلي عامل تورم واريانس برايj امين ضريب رگرسيون عبارت است از:
 
كه در آن R2j ضريب تعيين چندگانه است كه از رگرسيونXj نسبت به ديگر متغيرهاي رگرسيوني به دست مي آيد. عامل تورم واريانس بيش از ۱۰ موجب مشكلات حدي چند خطي چندگانه مي شود.
محك ارزيابي مدل هاي رگرسيوني زيرمجموعه
علاوه بر محك هاي ارزيابي شاملR-2,R2 تعديل شده و MSE (ميانگين مربعات باقيمانده) يك محك مهم ديگر Cp مالوس است كه به صورت ذيل تعريف مي گردد.
 
اگر مدلp جمله اي اريبي قابل صرف نظر كردن داشته باشند در اين صورت   خواهد بود و داريم.
 
الگوهاي خوب نوعاً مختصات (C,Cp) نزديك به خط ۴۵ درجه دارند همچنين بايد به خاطر داشته باشيم كه هنگام انتخاب متغيرها، متغيرهايي را انتخاب كنيم كهK متغير نامزد داشته باشيم ۲k معادله بررسي مي گردد كه نسبت به ديگر روش هاي انتخاب مدل از كارايي بالاتري برخوردار است. همچنين برآورد حداقل مربعات يك متغير رگرسيوني منفرد، به شدت به ديگر متغيرهاي رگرسيوني داخل مدل (به دليل جزيي بودن ضرايب) بستگي دارد. بنابراين ممكن است ضرايب رگرسيوني با افزايش متغيرهاي ديگر به شدت تغيير كرده و يا حتي تغيير علامت بدهد كه تغييرات زياد مشاهده شده در ضرايب هنگام حذف يا اضافه كردن متغيرها حاكي از همبستگي ذاتي بين متغيرها (هم خطي چندگانه) مي باشد.
رگرسيون نيرومند [۱۴]
هدف اصلي رگرسيون نيرومند، جدا كردن دور افتاده ها و به دست آوردن نتايج پايدار در حضور دور افتاده ها مي باشد. براي اين منظور، رگرسيون نيرومند اثر دور افتاده ها را محدود مي كند. اين دور افتاده ها مي تواند در فضايX، جهتY (پاسخ) و يا در هر دو جهت باشند.
روش هاي زيادي براي برخورد با اين مشكلات ارائه گرديده است، ساده ترين روش هم از  جهت محاسباتي و هم از نظر تئوري و همچنين مرسوم ترين روش، برآوردگر M هوبر مي‌باشد.

 
برآوردگرM
يك برآوردگرM بجاي مينيمم كردن مجموع مربعات باقيمانده، تابع باقيمانده ها را مينيمم مي كند.
 
براي مينيمم كردن، مشتقات مرتبه جزئي مرتبه اول  نسبت به  را مساوي صفر قرار مي‌دهيم.
كه در آن   عبارت است ازi امين مشاهده ازj امين متغير رگرسيوني مي باشد. در حالت كلي تابع   غيرخطي است و بايد با روش تكرار حل شود. اگر تكنيك هاي متعدد مطلوبيت غيرخطي بتواند به كار گرفته شود. حداقل مربعات موزون مجدد به طور وسيعي مورد استفاده قرار مي گيرد. اين تابع وزني به صورت زير تعريف مي گردد.
 
كه مي توان از انواع تابع وزني استفاده نمود، مرسوم ترين تابع وزني و حساس ترين آنها تابع وزني درجه دوم است كه به صورت ذيل تعريف مي گردد.
 
۴- مواد و روش ها
نتايج به دست آمده از گروه تحقيقاتي مركز بين المللي نساجي آمريكا در تگزاس در سال ۱۹۹۸ در اين تحقيق مورد استفاده قرار گرفته است ۸۷ نمونه مختلف پنبه با دستگاه HVI مورد آزمايش قرار گرفته است و هفت خصوصيت آن (استحكام، ازدياد طول، بيشتر از نصف ميانگين طول (UHML)، ضريب يكنواختي (UI)، ظرافت، درجه انعكاس نور و زردي الياف) با دستگاه (HVI) اندازه گيري شده است.
همچنين استحكام و ازدياد طول نخ با استفاده از دستگاه استحكام سنج C.R.E و پارامترهاي كيفي ديگر از دستگاه اولسترIII انجام گرفته است. لازم به ذكر مي باشد كه براي همه نمره نخ ها از فاكتور تاب   استفاده شده است. خلاصه اطلاعات آماري به دست آمده در جدول (۱) آمده است.
 
جدول (۱)
شاخص    انحراف معيار    ميانگين    ماكزيمم    مينيمم    خواص الياف/نخ
                    : الياف
X1    ۴۱/۱    ۹۵/۲۸    ۳۴    ۵/۲۶    (CN/Tex) استحكام دسته
X2    ۴۶/۰    ۲۴/۶    ۹/۶    ۳/۵    (%) ازديادطول
X3    ۳/۱    ۵/۲۶    ۵/۳۰    ۵/۲۴    UHML (mm)
X4    ۰۵/۱    ۵/۸۱    ۲/۸۳    ۱/۷۹    ضريب يكنواختي
X5    ۴۵/۰    ۲/۴    ۵    ۱/۳    (Mge/in) ظرافت
X6    ۲۸/۲    ۹۳/۷۶    ۴/۸۰    ۵/۷۰    درجه انعكاس نور
X7    ۷۲/۰    ۳۵/۹    ۴/۱۱    ۸    درجه زردي نخ
X8    ۲۸/۵    ۹/۲۳    ۸/۳۰    ۸/۱۵    (Ne) نمره نخ
X9    ۲/۲۷۸    ۲/۳۰۰    ۱۳۵۳    ۲۴    نقاط نازك (۵۰%)
X10    ۵/۵۳۲    ۸۳۳    ۲۵۴۶    ۲۴    نقاط كلفت X1 (50%)
X11    ۲/۳۰۰    ۲/۳۴۰    ۱۳۹۹    ۴۰    نپ (۲۰۰%)
X12    ۲/۱۰۷۱    ۵/۱۴۷۳    ۵۲۹۸    ۲۸۶    عيوب كل (I.P.I)
X13    ۸/۵۱    ۸/۱۵۳    ۳/۳۰۰    ۶/۱۰۱    تعداد‌الياف درسطح‌ مقطع‌(n)
Y1    ۱۳/۱    ۷۳/۱۴    ۰۲/۱۸    ۲۸/۱۲    استحكام نخ (CN/Tex)
Y2    ۷۷/۰    ۹/۵    ۵/۷    ۲۳/۴    ازدياد طول نخ
Y3    ۳۱/۲    ۰۱/۲۰    ۴۲/۲۶    ۳۵/۱۶    CV% جرمي نخ
Y4    ۵۹/۰    ۳/۵    ۶۶/۶    ۳۱/۴    پرز نخ (۱۰ سانتي متر)

۵- آناليز آماري
آناليز آماري- استحكام نخ
در ابتدا براي جلوگيري از مشكل هم خطي چند گانه و همچنين استفاده از همه داده هاي عيوب نخ فقط از متغير (I.P.I)X12 در مدل استفاده گرديده است، همچنين از تبديل متغير راديكال (X16) براي متغير X12 استفاده گرديده است.   اين تبديل رابطه بين Y1,X16 را به صورت خطي مي كند كه دياگرام باقيمانده جزئي آن در شكل (۱) نشان داده شده است.
همچنين جهت جداسازي نقاط دور افتاده از رگرسيون نيرومند استفاده گرديد. همچنين از برآوردگرM با C=3.5 استفاده شده است و جدول تشخيص نقاط دور افتاده در جدول (۱) نشان داد هشده است كه مشاهدات ۵۲و۵۳و۵۴ به عنوان نقاط دور افتاده در نظر گرفته شده است با توجه به اينكه اين نقاط مي تواند بدلايل غيرفني و يا مشكلات دستگاه آزمايشگاهي و يا خطاي آزمايشگر در نظر گرفته شود. بنابراين جهت محاسبات دقيقتر اين نقاط حذف مي گردد و مدل را براي ۸۴ باقيمانده برازش مي دهيم.
جهت انجام متغيرها، از روش همه رگرسيون هاي ممكن و با استفاده از محك هايR3,R2  تعديل شده و Cp مالوس استفاده گرديده است و نتايج آن در جدول (۲) نشان داده شده است.
با توجه به جدول مدل با ۴ متغيرX¬۱۶,X5,X4,X1 براي استحكام نخ(Y1) انتخاب مي گردد اين مدل داراي بالاترين R2  تعديل شده و كمترينCp مالوس است.
با توجه به اينكه Cp=3.565 كمتر از تعداد متغير به كار رفته در مدل (۴) مي باشد. بنابراين اين ۴ متغير به عنوان متغيرهاي پايه جهت استحكام نخ در نظر گرفته مي شود.
همچنين جهت آشكارسازي انحرافات از نرمال، نقاط دور افتاده، عدم تساوي واريانس و تخصيص تابعي غلط براي يك متغير رگرسيوني از نمودارهاي باقيمانده استفاده گرديده است. نمودار نرمال بودن در شكل (۲) و نمودار باقيمانده در مقابل مقدار برازش شده  در شكل (۳) نشان داده شده است كه هر دو نمودار انحراف خاصي را نشان نمي دهند و داده ها نرمال و واريانس داده ها نيز تقريباً ثابت مي باشند و نقطه دور افتاده خاصي مشاهده نمي‌شود.
جدول آناليز واريانس براي ۴ متغير انتخاب شده در جدول (۳) نشان داده شده است كه مناسب بودن مدل خطي را نشان مي دهد. همچنين برآوردهاي پارامتر در جدول (۴) نشان داده شده است. در اين جدول برآوردهاي استاندارد شده و همچنين شاخص هم خطي چندگانه (VIF) براي هر متغير نشان داده شده است. با توجه به اين جدول، شاخص هاي هم خطي حدود عدد يك مي باشند كه نشاندهنده مستقل بودن متغيرهاست و داده ها تقريباً متعامد هستند. همچنين ترتيب اهميت پارامترها از داده هاي استاندارد شده مشخص ميگردد كه به ترتيب پارامترهاي مؤثر در استحكام نخ   است همچنين ضريب همبستگي چندگانه   تبديل شده و ريشه باقيمانده ۴۶۵/۰ مي باشد كه مدل بسيار خوبي مي باشد همچنين جهت بررسي دقيقتر و آشكار شدن متعامد بودن متغيرهاي بدست آمده از رگرسيون متعامد نيز استفاده گرديد كه نتايج آن در جدول (۵) نشان داده شده است كه برآورد پارامترهاي بدست آمده با برآورد پارامترهاي بدست آمده به روش كمترين مربعات تقريباً يكسان مي باشند بنابراين مدل نهايي بدست آمده براي استحكام نخ بصورت ذيل مي باشد:
 
كه شكل اصلي آن به صورت :
 
نمودار باقيمانده مربوط به سه پارامتر ديگر نيز در شكل ۴ نشان داده شده است باتوجه به معادله به دست آمده و نمودارهاي باقيمانده با افزايش استحكام الياف ويكنواختي طولي الياف استحكام نخ افزايش مي يابد و با افزايش ميكرونر (ضخيم شدن الياف ) و تعداد عيوب نخ، استحكام نخ كاهش مي يابد همچنين براي تعيين اينكه چه مقدار تغييرات در مشاهدات جديد را ميتوان انتظار داشت كه مدل توضيح دهد از آماره Press  استفاده مي نمائيم با توجه به اختلاف كم بين SSE و Press و مقايسه مقدار آماره شبيه   براي پيش بيني مشاهدات جديد و مقدار   بدست آمده از مدل مشخص ميگردد كه اين مدل پيش بيني خوبي رانيز براي مشاهدات جديد ارائه مي كند.