با استفاده از آشنا آشنا

ساخت وبلاگ

از عملکرد Summon_Familiar برای تولید مدل هایی برای یک مجموعه داده معین استفاده می شود و پس از آن تجزیه و تحلیل گسترده ای ارائه می دهد. این تعدادی پرونده ایجاد می کند. بسیاری از پرونده های حاصل از این تجزیه و تحلیل نیز می توانند در خارج از Summon_Familiar استفاده شوند. به عنوان مثال ، مدل ها و مجموعه ها می توانند به صورت آینده نگر برای ارزیابی مجموعه داده های جدید استفاده شوند. به همین ترتیب ، از داده های داده و جمع آوری می توان برای سفارشی سازی نقشه برداری و صادرات به جداول استفاده کرد.

در این مثال ما از مجموعه داده های تولد جمع آوری شده در سال 1986 در مرکز پزشکی Baystate ، اسپرینگفیلد ، ماساچوست استفاده خواهیم کرد. این مجموعه داده حاوی داده های وزن هنگام تولد از 189 کودک تازه متولد شده است که برخی از آنها دارای وزن کم هنگام تولد (کمتر از 2. 5 کیلوگرم) هستند. عوامل خطر بالقوه نیز جمع آوری شد. ما سعی خواهیم کرد با استفاده از این عوامل خطر ، شاخص وزن کم هنگام تولد را پیش بینی کنیم.

ما ابتدا داده ها را به طور تصادفی در مجموعه داده های توسعه و اعتبار سنجی تقسیم خواهیم کرد:

بعد مجموعه داده را بیشتر آماده خواهیم کرد. ما ستون BWT را رها می کنیم زیرا این مستقیماً حاوی شاخصی است که می خواهیم پیش بینی کنیم. ستون های دیگر به عنوان متغیرهای طبقه بندی شده رمزگذاری می شوند.

سپس ما با summon_familiar مدل هایی برای داده ها ایجاد می کنیم و این موارد را ارزیابی می کنیم. ما یک گروه از پنج مدل رگرسیون لجستیک مجازات شده برای پیش بینی شاخص وزن کم هنگام تولد ، بر اساس بوت استرپ های مجموعه داده توسعه ایجاد خواهیم کرد. ممکن است متوجه شوید که ما در اینجا با استفاده از عملکرد Tempdir () به فهرست R موقت می نویسیم. در عمل شما می خواهید از یک دایرکتوری متفاوت استفاده کنید ، زیرا پس از بسته شدن جلسه R شما ، فهرست موقت R حذف می شود. برای سرعت ، ما همچنین فقط تخمین های نقطه را در طول ارزیابی محاسبه خواهیم کرد (به ارزیابی و توضیح برای گزینه های دیگر مراجعه کنید).

با استفاده از مدل های آینده نگر

مدل های تولید شده توسط آشنا در زیر مجموعه های پوشه treated_models ذخیره می شوند:

در دایرکتوری 5 مدل وجود دارد که در قالب RDS در پرونده های پایان یافته با *_model. rds ذخیره می شوند. ما می توانیم مدل اول را در فهرست بازرسی کنیم.

سپس از این مدل می توان برای پیش بینی مقادیر برای یک مجموعه داده معین ، از جمله موارد دیگر استفاده کرد. روش پیش بینی مورد استفاده توسط آشنا از بسیاری جهات مشابه سایر روشهای پیش بینی است. با این حال ، آشنا مستلزم تنظیم استدلال NewData است. این داده های توسعه را با مدل های خود ذخیره نمی کند تا اندازه مدل را محدود کند و از نشت اطلاعات حساس جلوگیری کند. پیش بینی ها را می توان به شرح زیر انجام داد:

علاوه بر پیش بینی های پیش فرض ، آشنا با تنظیم آرگومان نوع ، چندین نوع پیش بینی مختلف را امکان پذیر می کند. اینها هستند:

"تازگی": با استفاده از آشکارساز جدید که با هر مدل آموزش داده می شود ، از جدید بودن نمونه ای استفاده می کند. این می تواند برای تشخیص نمونه های خارج از توزیع که مدل برای برون یابی برای آن استفاده می کند ، استفاده شود.

"Survival_Probability": احتمال زنده ماندن را تا زمان مشخص شده توسط زمان پیش بینی کنید. این تنها برای برخی از مدل های بقا که در آن مقادیر پیش بینی شده می توانند به احتمالات بقا تبدیل شوند امکان پذیر است.

"Risk_stratification": گروه ریسک را که نمونه ای به آن اختصاص داده شده است پیش بینی کنید. این فقط برای مدل های بقا امکان پذیر است. به طور پیش فرض ، طبقه بندی با استفاده از مقادیر آستانه ایجاد شده در طول توسعه مدل انجام می شود. شما می توانید با تنظیم آرگومان طبقه بندی شده ، یک یا چند مقدار آستانه را به صورت دستی مشخص کنید.

به عنوان مثال ، ما می توانیم جدید بودن نمونه ها را به شرح زیر پیش بینی کنیم:

با این حال ، قدرتمندتر توانایی انجام هر یک از مراحل ارزیابی و توضیح برای یک مجموعه داده جدید ، از جمله تنظیمات جدید است. به طور پیش فرض ، تمام مراحل ارزیابی و توضیح با استفاده از تنظیمات تعریف شده هنگام اجرای summon_familiar انجام می شود. در این حالت این بدان معنی است که تخمین های نقطه محاسبه می شوند.

به عنوان مثال اجازه دهید عملکرد مدل AUC-ROC و دقت مدل را برای مدل محاسبه و نقشه کنیم.

ممکن است متوجه شوید که هیچ نقشه ای تولید نمی شود. این امر به این دلیل است که نوع ویولن_پل و تخمین_پای ارثی از مدل ناسازگار هستند. با این حال ، هیچ چیز مانع از تغییر نوع تخمین به فواصل اعتماد به نفس Bootstrap BCI نمی شود.

توجه داشته باشید که ما می توانیم بدون وارد کردن صریح مدل ، به همان نتیجه برسیم. ارائه مسیر به مدل به عنوان استدلال شیء کافی است:

با استفاده از مجموعه های مدل های آینده نگر

پنج مدل ایجاد شده در مثال یک گروه را تشکیل می دهند. به جای بررسی مدل ها به طور جداگانه ، می توانیم مجموعه مدل را نیز ارزیابی کنیم. مجموعه های مدل تولید شده توسط آشنا در همان زیر مجموعه پوشه treated_models به عنوان مدل های تشکیل دهنده آنها ذخیره می شوند:

در این حالت فقط یک گروه در دایرکتوری وجود دارد که در قالب RDS در پرونده ای که با *_ENSEMBLE. RDS پایان می یابد ، ذخیره می شود. برخی از طرح های آزمایش جایگزین ، به عنوان مثالمواردی که شامل اعتبارسنجی متقابل هستند ، می توانند منجر به تشکیل چندین گروه شوند. ما می توانیم گروه را در فهرست بازرسی کنیم.

برای پیش بینی می توان از مجموعه مدل های مدل استفاده کرد:

گروه ها در مراحل ارزیابی و توضیح به طور مشابه با مدل ها رفتار می کنند:

یک محدودیت مهم برای استفاده از گروه ها وجود دارد. به طور معمول ، هنگام بارگیری یک گروه ، مدل ها به گروه وصل نمی شوند. در عوض ، ویژگی Model_List از شیء گروه شامل لیستی از مسیرهای مکان فایلهای مدل در ایجاد است. بنابراین ، اگر این پرونده ها را جابجا کنید ، گروه دیگر نمی توانند مدل ها را پیدا و وصل کنند. دو راه برای جلوگیری از این مسئله وجود دارد.

اولین راه استفاده از روش update_model_dir_path () برای اشاره به گروه به فهرست جدید است. دومین روش عمومی تر ، ایجاد یک گروه در پرواز از مدل های زیرین است. برای انجام این کار ، ما لیستی از مدل ها یا مسیرهایی را برای این مدل ها به عنوان آرگومان شیء برای روش های نقشه و روش های صادرات جدولی تهیه می کنیم.

سفارشی سازی صادرات و توطئه ها

آشنا همچنین داده های داده و جمع آوری را تولید می کند. اشیاء داده داده های ارزیابی پردازش شده حاصل از یک مجموعه داده خاص را دارند و در پوشه Actival_Data یافت می شوند.

در مثال ما ، ما سه شیء داده ایجاد کردیم: یکی برای توسعه داخلی ، دیگری برای اعتبار داخلی و دیگری برای داده های اعتبار سنجی خارجی. این اشیاء داده جداگانه در یک شیء مجموعه جمع آوری می شوند که در پوشه Actival_Collections یافت می شود.

به طور معمول فقط یک مجموعه در این مکان وجود دارد ، اما اگر Summon_Familiar با ارزیابی_top_level_only = false فراخوانی شود ، ممکن است بیشتر وجود داشته باشد.

توجه داشته باشید که داده های داده و جمع آوری استاتیک هستند. ما نمی توانیم از آنها به عنوان مدل و مجموعه ها انعطاف پذیر استفاده کنیم. به عنوان مثال ، ما نمی توانیم معیارهای مختلف عملکرد را با استفاده از داده های ذخیره شده در داده های آشنا و مجموعه های جمع آوری ارزیابی کنیم یا از این اشیاء برای پیش بینی نتایج برای مجموعه داده های جدید استفاده کنیم. در زیر استثنائات این قانون وجود دارد:

EXPORT_FS_VIMP ، EXPORT_MODEL_VIMP ، و PLOT_VARIABLE_IMPORTANCE و روشهای مشتق شده آن (PLOT_FEATURE_SELECTION_VARIABLE_IMONDANCE ، PLOT_FEATURE_SOCKURENCE ، PLOT_MODEL_SIGNATER_VARIABLE_IMOTIESS و PLOT_MODEL_SIGNATERESIGESIGRATION)

EXPORT_FEATURE_SIMILARITY ، EXPORT_SAMPLE_SIMILARITY ، EXPORT_FEATURE_EXPRESSION ، PLOT_FEATURE_SIMILARITY و PLOT_SAMPLE_CUMPLESING برای مشخص کردن استدلال های خوشه بندی امکان پذیر است ، اما متریک شباهت برای ارزیابی فاصله بین ویژگی ها نیست. در داخل ، داده ها و اشیاء جمع آوری ماتریس فاصله را ذخیره می کنند.

استفاده اصلی از داده ها و اشیاء جمع آوری برای سفارشی سازی نقشه برداری است. به عنوان مثال ، منحنی های AUC-ROC برای هر گونه با استفاده از پالت پیش فرض در آشنا و یک موضوع سفارشی مبتنی بر Cowplot :: theme_cowplot ترسیم می شوند. ما می توانیم با استفاده از پالت استاندارد R و یک موضوع متفاوت برای تغییر ظاهر آن ، دوباره طرح را ایجاد کنیم.

مجموعه های صادراتی

تولید داده های نقشه می تواند زمان غیر مهم را به خود اختصاص دهد. از این رو ممکن است ترجیح داده شود که شیء مجموعه در دسترس باشد تا توطئه ها بتوانند سریعتر تغییر و ایجاد شوند. برای انجام این کار ، می توانیم با یک روش صادرات یا طرح با Export_Collection = True تماس بگیریم.

متغیر plot_data لیستی است که شامل دو مورد (در اینجا) است: جمع آوری و plot_list. از شیء مجموعه می توان برای تغییر عناصر طرح مانند موضوع و پالت استفاده کرد.< SPAN> استفاده اصلی از داده ها و اشیاء جمع آوری برای سفارشی سازی نقشه برداری است. به عنوان مثال ، منحنی های AUC-ROC برای هر گونه با استفاده از پالت پیش فرض در آشنا و یک موضوع سفارشی مبتنی بر Cowplot :: theme_cowplot ترسیم می شوند. ما می توانیم با استفاده از پالت استاندارد R و یک موضوع متفاوت برای تغییر ظاهر آن ، دوباره طرح را ایجاد کنیم.

فارکس وکسب درامد...
ما را در سایت فارکس وکسب درامد دنبال می کنید

برچسب : نویسنده : آرش اصل زاد بازدید : 46 تاريخ : جمعه 11 فروردين 1402 ساعت: 19:09