رگرسیون خطی

ساخت وبلاگ

این ویژگی در ردیف آلفا است. برای اطلاعات بیشتر در مورد ردیف های ویژگی ، به API Tiers مراجعه کنید.

رگرسیون خطی یک روش رگرسیون اساسی یادگیری ماشین است. این یک مدل را با به حداقل رساندن یک عملکرد از دست دادن که به یک ماتریس وزن و به داده های آموزش بستگی دارد ، آموزش می دهد. ضرر را می توان به عنوان مثال با استفاده از نزول شیب به حداقل رساند. Neo4J Graph Data Science از Adam Optimizer استفاده می کند که یک الگوریتم نوع نزول شیب است.

وزنه ها به صورت یک بردار با اندازه w و یک تعصب b هستند. عملکرد از دست دادن پس از آن به صورت زیر تعریف می شود:

برای جلوگیری از بیش از حد ، ممکن است یک اصطلاح منظم به ضرر اضافه کند. Neo4J Graph Data Science از گزینه تنظیم L2 پشتیبانی می کند که می تواند با استفاده از پارامتر مجازات پیکربندی شود.

1. تنظیم Hyperparameters

به منظور تعادل موضوعاتی از قبیل تعصب در مقابل واریانس مدل و سرعت در مقابل مصرف حافظه آموزش ، GDS چندین ابر پارامتری را در معرض دید قرار می دهد که می توان آن را تنظیم کرد. هر یک از این موارد در زیر شرح داده شده است.

در تمرینات مبتنی بر تبار شیب ، ما سعی می کنیم بهترین وزن را برای مدل خود پیدا کنیم. در هر دوره ما تمام نمونه های آموزش را برای محاسبه از دست دادن و شیب وزنه ها پردازش می کنیم. سپس از این شیب ها برای به روزرسانی وزنه ها استفاده می شود. برای به روزرسانی ما از Adam Optimizer همانطور که در https://arxiv. org/pdf/1412. 6980. pdf توضیح داده شده است ، استفاده می کنیم.

آمار مربوط به این آموزش در گزارش اشکال زدایی NEO4J گزارش شده است.

1. 1حداکثر دوره

این پارامتر حداکثر تعداد دوره ها را برای آموزش تعریف می کند. مستقل از کیفیت مدل ، آموزش پس از این دوره های بسیاری خاتمه می یابد. توجه داشته باشید که در صورت همگرایی ضرر ، این آموزش نیز می تواند زودتر متوقف شود (به صبر و تحمل مراجعه کنید.

تنظیم این پارامتر می تواند برای محدود کردن زمان آموزش برای یک مدل مفید باشد. محدود کردن بودجه محاسباتی می تواند به هدف تنظیم و کاهش بیش از حد در خدمت باشد ، که با تعداد زیادی از دوره ها به یک خطر تبدیل می شود.

1. 2حداقل دوره

این پارامتر حداقل تعداد دوره های آموزش را مشخص می کند. مستقل از کیفیت مدل ، آموزش حداقل این دوره های بسیاری را اجرا می کند.

تنظیم این پارامتر می تواند برای جلوگیری از توقف زودرس مفید باشد ، اما همچنین حداقل زمان آموزش یک مدل را افزایش می دهد.

1. 3صبر

این پارامتر حداکثر تعداد دوره های متوالی غیرمولد را تعریف می کند. یک دوره غیرمولد است اگر حداقل با کسری از تحمل از دست دادن فعلی ، از دست دادن آموزش را بهبود بخشد.

با فرض اینکه این آموزش برای MinePochs اجرا شود ، این پارامتر هنگام همگرایی آموزش تعریف می کند.

تنظیم این پارامتر می تواند به یک آموزش قوی تر منجر شود و از خاتمه زودهنگام مشابه MinePochs جلوگیری کند. با این حال ، صبر زیاد می تواند منجر به اجرای دوره های بیشتر از حد لازم شود.

در تجربه ما ، مقادیر معقول برای صبر در محدوده 1 تا 3 قرار دارد.

1. 4تحمل

این پارامتر مشخص می کند که یک دوره غیرمولد تلقی می شود و همراه با صبر ، معیارهای همگرایی را برای آموزش تعریف می کند. یک دوره غیرمولد است اگر حداقل با کسری از تحمل از دست دادن فعلی ، از دست دادن آموزش را بهبود بخشد.

تحمل کمتر منجر به آموزش حساس تر با احتمال بالاتر برای آموزش طولانی تر می شود. تحمل بالا به معنای آموزش کمتر حساس است و از این رو دوره های بیشتری به عنوان غیرمولد شمرده می شوند.

1. 5میزان یادگیری

هنگام به روزرسانی وزنه ها ، ما در جهت دیکته شده توسط Adam Optimizer بر اساس شیب عملکرد ضرر حرکت می کنیم. چقدر در هر بروزرسانی وزن حرکت می کنیم ، می توانید از طریق پارامتر LeaingRate پیکربندی کنید.

1. 6اندازه دسته

این پارامتر مشخص می کند که تعداد نمونه های آموزشی در یک دسته واحد گروه بندی می شوند.

شیب ها با استفاده از همزمان بسیاری از موضوعات ، به طور همزمان روی دسته ها محاسبه می شوند. در پایان یک دوره ، شیب ها قبل از به روزرسانی وزنه ها خلاصه و مقیاس می شوند. BatchSize بر کیفیت مدل تأثیر نمی گذارد ، اما می تواند برای تنظیم سرعت آموزش استفاده شود. یک دسته بزرگتر باعث افزایش مصرف حافظه محاسبات می شود.

این صفحه به شما کمک کرد؟

فارکس را از کجا شروع کنیم...
ما را در سایت فارکس را از کجا شروع کنیم دنبال می کنید

برچسب : نویسنده : لیما اصغرپورسازونی بازدید : 36 تاريخ : دوشنبه 13 شهريور 1402 ساعت: :