-
massively parallel feature selection: an approach based on variance preservation
جزئیات بیشتر مقاله- تاریخ ارائه: 1392/07/24
- تاریخ انتشار در تی پی بین: 1392/07/24
- تعداد بازدید: 1076
- تعداد پرسش و پاسخ ها: 0
- شماره تماس دبیرخانه رویداد: -
advances in computer technologies have enabled corporations to accumulate data at an unprecedented speed. large-scale business data might contain billions of observations and thousands of features, which easily brings their scale to the level of terabytes. most traditional feature selection algorithms are designed and implemented for a centralized computing architecture. their usability significantly deteriorates when data size exceeds tens of gigabytes. high-performance distributed computing frameworks and protocols, such as the message passing interface (mpi) and mapreduce, have been proposed to facilitate software development on grid infrastructures, enabling analysts to process large-scale problems efficiently. this paper presents a novel large-scale feature selection algorithm that is based on variance analysis. the algorithm selects features by evaluating their abilities to explain data variance. it supports both supervised and unsupervised feature selection and can be readily implemented in most distributed computing environments. the algorithm was implemented as a sas high-performance analytics procedure, which can read data in distributed form and perform parallel feature selection in both symmetric multiprocessing mode (smp) and massively parallel processing mode (mpp). experimental results demonstrated the superior performance of the proposed method for large scale feature selection.
مقالات جدیدترین رویدادها
-
استفاده از تحلیل اهمیت-عملکرد در ارائه الگوی مدیریت خلاقیت سازمانی و ارائه راهکار جهت بهبود
-
بررسی تاثیر ارزش وجوه نقد مازاد بر ساختار سرمایه شرکت های پذیرفته شده در بورس اوراق بهادار تهران
-
بررسی تأثیر سطح افشای ریسک بر قرارداد بدهی شرکت های پذیرفته شده در بورس اوراق بهادار تهران
-
بررسی تأثیر رتبه بندی اعتباری مبتنی بر مدل امتیاز بازار نوظهور بر نقد شوندگی سهام با تأکید بر خصوصی سازی شرکت ها
-
تأثیر آمیخته بازاریابی پوشاک ایرانی بر تصویر ذهنی مشتری پوشاک ایرانی (هاکوپیان)
-
رابطه ابراز وجود با سلامت روان بر حسب جنسیت
-
محاسبه عمق بحرانی در کانال های با مقاطع منظم و نامنظم با استفاده از الگوریتم بهینه سازی تجمع ذرات (pso)
-
تحلیل راهبردی نقش مجتمع های ایستگاهی در توسعه حمل و نقل محور(tod) (مطالعه موردی،استگاه متروی صادقیه)
-
بررسی ادله اثباتی جرم از دیدگاه فقه و قانون مجازات
-
بررسی تاثیر روش تدریس همیاری بر مهارت های اجتماعی دانش آموزان
مقالات جدیدترین ژورنال ها
-
مدیریت و بررسی افسردگی دانش آموزان دختر مقطع متوسطه دوم در دروان کرونا در شهرستان دزفول
-
مدیریت و بررسی خرد سیاسی در اندیشه ی فردوسی در ادب ایران
-
واکاوی و مدیریت توصیفی قلمدان(جاکلیدی)ضریح در موزه آستان قدس رضوی
-
بررسی تاثیر خلاقیت، دانش و انگیزه کارکنان بر پیشنهادات نوآورانه کارکنان ( مورد مطالعه: هتل های 3 و 4 ستاره استان کرمان)
-
بررسی تاثیر کیفیت سیستم های اطلاعاتی بر تصمیم گیری موفق در شرکتهای تولیدی استان اصفهان (مورد مطالعه: مدیران شرکتهای تولیدی استان اصفهان)
-
تاثیر جایزه کالایی و تخفیفات دوره ای قیمت بر رفتار پرداخت مصرف کننده
-
محاسبه کتاب فرهنگ و تمدن اسلامی در قم قرن سوم هجری، تاریخ قم از 182 تا 420، تاریخ محلی قم از ورود اسلام تا سقوط ال بویه
-
بررسی وضعیت اجرای راهبرد مدیریت دانش در کنترل بحران های اجتماعی
-
بررسی مراحل و اجزای مختلف برنامه های آموزشی و درسی در اجرا
-
بررسی نقش تعدیلی استقلال هیئت مدیره بر رابطه بین گزارشگری مالی متقلبانه و بازده سهام شرکت های پذیرفته شده در بورس اوراق بهادار تهران
سوال خود را در مورد این مقاله مطرح نمایید :