کسی که با مدلها برای رسیدن به دقت بالا در پروژه های یادگیری ماشین کار میکند، حتما میدونه که یکی از فازهای خیلی مهم در مسائل یادگیری ماشین فاز اعتبارسنجی و ارزیابی مدله. اینکه از چه معیاری و کجا رو چه نوع داده ای استفاده کنیم.اینجا تمرکزم مدلهای پیش بینی و رگرسیونهمزایا و معایب هر کدوم رو نام میبرم و میگم کجا بهتره ازش استفاده کنیم:
معیار 𝗥𝗠𝗦𝗘 (𝗥𝗼𝗼𝘁 𝗠𝗲𝗮𝗻 𝗦𝗾𝘂𝗮𝗿𝗲𝗱 𝗘𝗿𝗿𝗼𝗿): 🟢 مزایامیانگین بزرگی خطا را اندازهگیری میکند، و خطاها را به توان دو میرساند تا اختلافات بزرگتر را برجسته کند. مناسب برای زمانی که به حداقل رساندن خطاهای قابل توجه بسیار مهم است، زیرا انحرافات بزرگ را جریمه میکند.
معایب→ خطای RMSE:اگر هدف اولویتبندی خطاهای بزرگ نباشد، RMSE میتواند گمراهکننده باشد، زیرا به دادههای پرت وزن زیادی میدهد.
معیار شاخص MAE
یکی از ساده ترین معیارهای ارزیابی مدلهای رگرسیونی می باشد. این شاخص متوسط اندازه خطای پیش بینی را محاسبه می کند و تفسیر خوبی از میزان اثربخشی مدل فراهم میکند.
معیار→ R²:
معیار ² درصد تغییرپذیری در دادههایی که توسط مدل ثبت میشوند را نشان میدهد و درک آن را آسان میکند.
معایببه شدت تحت تأثیر مقادیر بسیار زیاد قرار دارد که میتواند منجر به ارائه نادرست اطلاعات شود.مفهوم واضحی از اندازه واقعی خطا ارائه نمیدهد.
معیار MAPE
خطاها را به صورت درصد ارائه میدهد و این امر آن را شهودی و توضیح آن را آسان میکند.کمتر حساس به داده های پرت : برخلاف RMSE، اگر مقادیر واقعی نیز بالا باشند، MAPE با یک یا دو خطای بالا از کوره در نمیرود.(منفجر نمیشه)
معایب: MAPE میتواند وقتی مقادیر واقعی نزدیک به صفر باشند، گمراهکننده باشد و منجر به خطاهای بسیار بالایی شود. مثلا فروش صفر باشد پایدار نیست بهتره از SMAPE استفاده بشه.
معیار 𝗥𝗠𝗦𝗘 (𝗥𝗼𝗼𝘁 𝗠𝗲𝗮𝗻 𝗦𝗾𝘂𝗮𝗿𝗲𝗱 𝗘𝗿𝗿𝗼𝗿): 🟢 مزایامیانگین بزرگی خطا را اندازهگیری میکند، و خطاها را به توان دو میرساند تا اختلافات بزرگتر را برجسته کند. مناسب برای زمانی که به حداقل رساندن خطاهای قابل توجه بسیار مهم است، زیرا انحرافات بزرگ را جریمه میکند.
یکی از ساده ترین معیارهای ارزیابی مدلهای رگرسیونی می باشد. این شاخص متوسط اندازه خطای پیش بینی را محاسبه می کند و تفسیر خوبی از میزان اثربخشی مدل فراهم میکند.
معیار ² درصد تغییرپذیری در دادههایی که توسط مدل ثبت میشوند را نشان میدهد و درک آن را آسان میکند.
خطاها را به صورت درصد ارائه میدهد و این امر آن را شهودی و توضیح آن را آسان میکند.کمتر حساس به داده های پرت : برخلاف RMSE، اگر مقادیر واقعی نیز بالا باشند، MAPE با یک یا دو خطای بالا از کوره در نمیرود.(منفجر نمیشه)
۴۴۳
۱۱:۱۶
این روزها ابزارهای AI فقط برای چت کردن نیستند و کمکم دارند تبدیل میشوند به دستیار کامل مطالعه و یادگیری. یکی از سایتهای جالب در این حوزه، StudentAI هست: https://studentai.app/
این پلتفرم مجموعهای از ابزارهای هوش مصنوعی را برای درس، تحقیق، تولید محتوا، برنامهنویسی و حتی آمادگی شغلی کنار هم آورده. مثلاً میتوانید PDF یا جزوه آپلود کنید تا خلاصهسازی شود، از داخل فایل سوال بپرسید یا نکات مهم استخراج شود. حتی لینک ویدیوی یوتیوب را هم میگیرد و تبدیلش میکند به خلاصه و Study Notes.
بخش جالب دیگرش ابزارهای نوشتاری و دانشگاهی است؛ از Essay و Paraphrasing گرفته تا تولید SOP، Cover Letter و Citation. علاوه بر این، چند AI Tutor و دستیار تخصصی هم دارد که برای یادگیری، مصاحبه شغلی یا کمک در برنامهنویسی طراحی شدهاند.
در واقع این نوع پلتفرمها دارند ترکیبی از ChatGPT + ابزار تحقیق + معلم خصوصی + دستیار تولید محتوا را در یک محیط ارائه میکنند. البته مثل هر ابزار AI، خروجیها نیاز به بررسی دارند و نباید بدون بازبینی برای کار علمی استفاده شوند؛ اما برای یادگیری سریعتر، خلاصهسازی و ایده گرفتن واقعاً میتوانند مفید باشند.
۵۶۱
۱۸:۳۶
Important role
۴۳۴
۱۹:۰۳
لطفا به هیچ عنوان برای این عنوان های شغلی با این رنج حقوق پیشنهادی، درخواست ندین. آنقدر که قضیه واضحه که حتی نخواستم متن طولانی بنویسم و حالت امری نوشتم. قطعا متخصصی که مهارتهای مورد نیاز شما رو داشته باشه و سابقه کار مورد نیاز شما
الان با پنجاه درصد حقوق و بیمه بیکاری از این عدد خیلی بیشتر دریافت میکنه.
۳۷۶
۹:۰۷
بیشتر مردم فکر میکنند همهٔ مدلهای هوش مصنوعی شبیه هم هستند.اما در سیستمهای واقعی هوش مصنوعی، مخصوصاً در ایجنتهای هوش مصنوعی (AI Agents)، انواع مختلف مدلهای زبانی نقشهای متفاوتی دارند.این ۸ نوع مدل، آیندهٔ سیستمهای مدرن هوش مصنوعی را شکل میدهند:۱. GPT (ترنسفورمر از پیش آموزشدیده مولد)برای تولید محتوا، پاسخگویی و استدلال عمومی.۲. MoE (ترکیب متخصصها)شبکههای تخصصی مختلف را فعال میکند → سریعتر و بهینهتر در مقیاس بزرگ.۳. LRM (مدل بزرگ استدلال)برای تفکر چندمرحلهای پیچیده و تصمیمگیری طراحی شده است.۴. VLM (مدل بینایی-زبان)تصویر و متن را بهصورت همزمان درک میکند.۵. SLM (مدل زبانی کوچک)سبک، سریع و کمهزینه؛ مناسب برای مسیریابی درخواستها یا وظایف ساده.۶. LAM (مدل بزرگ اقدام)بر انجام عمل، استفاده از ابزارها و تعامل با APIها تمرکز دارد.۷. HLM (مدل زبانی سلسلهمراتبی)مسائل پیچیده را به لایهها و بخشهای ساختاریافته تقسیم میکند.۸. LCM (مدل بزرگ مفهومی)بهجای تمرکز صرف بر کلمات یا توکنها، مفاهیم سطح بالا را درک میکند.
تغییری که الان در حال رخ دادن است:از یک مدل واحد: به سیستمهای چندمدلیاز چتبات : به ایجنت هوش مصنوعیاز پاسخ دادن : به انجام دادن
مهندسان برجستهٔ هوش مصنوعی فقط یک مدل انتخاب نمیکنند؛آنها معماری مناسب مدل را متناسب با نیاز هر مسئله طراحی میکنند.
اگر در حال ساخت AI Agent هستی، درک این تفاوتها میتواند مزیت مهم تو باشد.
کانال تحلیل داده و هوش مصنوعی@ai_with_mina
تغییری که الان در حال رخ دادن است:از یک مدل واحد: به سیستمهای چندمدلیاز چتبات : به ایجنت هوش مصنوعیاز پاسخ دادن : به انجام دادن
مهندسان برجستهٔ هوش مصنوعی فقط یک مدل انتخاب نمیکنند؛آنها معماری مناسب مدل را متناسب با نیاز هر مسئله طراحی میکنند.
اگر در حال ساخت AI Agent هستی، درک این تفاوتها میتواند مزیت مهم تو باشد.
کانال تحلیل داده و هوش مصنوعی@ai_with_mina
۴۹۸
۱۰:۵۰
از حق نگذریم،
سوپر اپ
خیلی عجیب بود، یه فایل سه مگ رو ارسال نمیکرد اما تماس صوتی و تصویریش عالی بود(بود یا هست؟
) . فول hd
سوپر اپ
۲۰۹
۱۴:۴۶
در حال حاضر نمایش این پیام پشتیبانی نمیشود.
این مقاله از Towards Data Science درباره استفاده از یادگیری ماشین برای پیشبینی نتایج جام جهانی ۲۰۲۶ است که از ۱۱ ژوئن در استادیوم مکزیکوسیتی آغاز میشود.
نویسنده مجموعهای از دادهها شامل حدود ۴۹٬۰۰۰ بازی فوتبال (از سال ۱۸۷۲ تا ۲۰۲۶) را گرد هم آورده که شامل امتیازات الو (Elo)، نتایج بازیها و محل برگزاری مسابقات است.
نکات اصلی مقاله:
• نویسنده با رویکردی احتمالاتی، چند مدل یادگیری ماشین مختلف (از جمله LightGBM) را با هم مقایسه میکند تا بهترین مدل برای پیشبینی نتایج بازیها (برد میزبان، برد مهمان، یا تساوی) را پیدا کند.
• یکی از یافتهها این است که مدلها تمایل دارند نتیجه تساوی را نادیده بگیرند و آن را به اشتباه بهعنوان «برد میزبان» پیشبینی کنند، در حالی که حدود ۲۰٪ بازیها واقعاً با تساوی پایان مییابند.
• برای بهبود این مشکل، ویژگیهای جدیدی مانند تفاوت امتیاز تیمها، نرخ تساوی در ۵ بازی اخیر، و اینکه آیا بازی در زمین خودی، زمین بیطرف یا دوستانه برگزار میشود، به مدل اضافه میشوند.
یه نگاه فنی و جذاب به دنیای فوتبال از دریچهی داده و یادگیری ماشین، برای کسایی که هم به فوتبال علاقه دارن هم به دیتا ساینس.لینک مقاله:https://towardsdatascience.com/can-machine-learning-predict-the-world-cup/?utm_campaign=tds daily&utm_medium=email&_hsenc=p2ANqtz--LU3CIkhxuvYVyz6NFMt1dg7-nDryNr1Thfi5oncaXlzuiYqjk_TH3XJRK6HiYbSiUUR9NumraggEdIFFHxbqqN45M-g&_hsmi=423013673&utm_source=newsletter
نویسنده مجموعهای از دادهها شامل حدود ۴۹٬۰۰۰ بازی فوتبال (از سال ۱۸۷۲ تا ۲۰۲۶) را گرد هم آورده که شامل امتیازات الو (Elo)، نتایج بازیها و محل برگزاری مسابقات است.
نکات اصلی مقاله:
• نویسنده با رویکردی احتمالاتی، چند مدل یادگیری ماشین مختلف (از جمله LightGBM) را با هم مقایسه میکند تا بهترین مدل برای پیشبینی نتایج بازیها (برد میزبان، برد مهمان، یا تساوی) را پیدا کند.
• یکی از یافتهها این است که مدلها تمایل دارند نتیجه تساوی را نادیده بگیرند و آن را به اشتباه بهعنوان «برد میزبان» پیشبینی کنند، در حالی که حدود ۲۰٪ بازیها واقعاً با تساوی پایان مییابند.
• برای بهبود این مشکل، ویژگیهای جدیدی مانند تفاوت امتیاز تیمها، نرخ تساوی در ۵ بازی اخیر، و اینکه آیا بازی در زمین خودی، زمین بیطرف یا دوستانه برگزار میشود، به مدل اضافه میشوند.
۳۶۰
۱۸:۵۰
چرا پیرسون برای روابط غیرخطی مناسب نیست؟
همبستگی پیرسون تنها تغییرات خطی را اندازهگیری میکند. اگر دادهها دارای رابطه غیرخطی باشند، پیرسون نمیتواند آن را به درستی تشخیص دهد، زیرا این روش بر اساس محاسبه میانگین و انحراف معیار عمل میکند. در مقابل، همبستگی اسپیرمن که بر اساس رتبهبندی دادهها است، میتواند روابط غیرخطی را نیز به خوبی شناسایی کند.
به عنوان مثال اگر رابطه بین رشد جمعیت و مصرف انرژی که به صورت نمایی و لگاریتمی است را بررسی کنیم، همبستگی اسپیرمن مناسب تر است
همبستگی پیرسون تنها تغییرات خطی را اندازهگیری میکند. اگر دادهها دارای رابطه غیرخطی باشند، پیرسون نمیتواند آن را به درستی تشخیص دهد، زیرا این روش بر اساس محاسبه میانگین و انحراف معیار عمل میکند. در مقابل، همبستگی اسپیرمن که بر اساس رتبهبندی دادهها است، میتواند روابط غیرخطی را نیز به خوبی شناسایی کند.
به عنوان مثال اگر رابطه بین رشد جمعیت و مصرف انرژی که به صورت نمایی و لگاریتمی است را بررسی کنیم، همبستگی اسپیرمن مناسب تر است
۱۶۱
۶:۳۴
بازارسال شده از معرفی موقعیتهای شغلی( حوزه هوش تجاری و داده کاوی)
فرصت کارآموزی تخصصی – شرکت طراحی و مهندسی صنایع انرژی (EIED)شرکت EIED بعنوان یکی از شرکتهای پیشرو در حوزه پیمانکاری صنعت نفت، گاز و پتروشیمی، به منظور شناسایی جوانان مستعد و پرتلاش، ایجاد فضای رشد برای آنها و در نهایت بهرهمندی از ظرفیت توانمندیهای آنان، در حوزههای هوش تجاری (BI)، فرآیندکاوی (Process Mining) و بهسازی سیستمها و روشها از دانشجویان مستعد و هدفمند برای دوره کارآموزی حرفهای دعوت مینماید.
این دوره شامل همکاری در پروژههای واقعی صنعتی و انتقال دانش توسط متخصصان ارشد است.
دو جایگاه کارآموزی بر اساس تخصص:
کد ۱ – کارآموز هوش تجاری (BI Trainee)
صلاحیتهای مورد نیاز:
دانشجوی رشته مهندسی صنایع، فناوری اطلاعات (IT) – از دانشگاههای سراسری مطرح تهرانتسلط به زبان برنامهنویسی Python (در سطح تحلیل داده)آشنایی با SQL (نوشتن کوئریهای ساده)مهارت در مصورسازی داده و طراحی داشبورد با Power BI (الزامی)آشنایی با اصول داستانسرایی داده (Data Storytelling)برخورداری از تفکر سیستمی و فرآیندمحور
کد ۲ – کارآموز سیستم و روشها (Systems & Methods Trainee)
صلاحیتهای مورد نیاز:
دانشجوی رشته مهندسی صنایع – از دانشگاههای سراسری مطرح تهرانتسلط کامل به استاندارد BPMN 2.0مهارت عملی با ابزارهای مدلسازی فرآیند Visual Paradigm، Camunda، Bizagi (حداقل یک مورد)آشنایی با مفاهیم فرآیندکاوی (Process Mining) – (آشنایی با Celonis مزیت است)توانایی مستندسازی رویههای اجرایی و نگارش دستورالعملهای کاریآشنایی مقدماتی با زبان برنامه نویسی Python (اختیاری – مزیت محسوب میشود)دارای تفکر سیستمی و نگاه فرآیندمحور با تمرکز بر بهبود مستمر
مزایای دوره کارآموزی در شرکت EIED:
فعالیت در فضای کاملاً حرفهای، پروژهمحور و مبتنی بر استانداردهای بینالمللی
فرصت کارآموزی تخصصی – شرکت طراحی و مهندسی صنایع انرژی (EIED)شرکت EIED بعنوان یکی از شرکتهای پیشرو در حوزه پیمانکاری صنعت نفت، گاز و پتروشیمی، به منظور شناسایی جوانان مستعد و پرتلاش، ایجاد فضای رشد برای آنها و در نهایت بهرهمندی از ظرفیت توانمندیهای آنان، در حوزههای هوش تجاری (BI)، فرآیندکاوی (Process Mining) و بهسازی سیستمها و روشها از دانشجویان مستعد و هدفمند برای دوره کارآموزی حرفهای دعوت مینماید.
این دوره شامل همکاری در پروژههای واقعی صنعتی و انتقال دانش توسط متخصصان ارشد است.
دو جایگاه کارآموزی بر اساس تخصص:
کد ۱ – کارآموز هوش تجاری (BI Trainee)
صلاحیتهای مورد نیاز:
دانشجوی رشته مهندسی صنایع، فناوری اطلاعات (IT) – از دانشگاههای سراسری مطرح تهرانتسلط به زبان برنامهنویسی Python (در سطح تحلیل داده)آشنایی با SQL (نوشتن کوئریهای ساده)مهارت در مصورسازی داده و طراحی داشبورد با Power BI (الزامی)آشنایی با اصول داستانسرایی داده (Data Storytelling)برخورداری از تفکر سیستمی و فرآیندمحور
کد ۲ – کارآموز سیستم و روشها (Systems & Methods Trainee)
صلاحیتهای مورد نیاز:
دانشجوی رشته مهندسی صنایع – از دانشگاههای سراسری مطرح تهرانتسلط کامل به استاندارد BPMN 2.0مهارت عملی با ابزارهای مدلسازی فرآیند Visual Paradigm، Camunda، Bizagi (حداقل یک مورد)آشنایی با مفاهیم فرآیندکاوی (Process Mining) – (آشنایی با Celonis مزیت است)توانایی مستندسازی رویههای اجرایی و نگارش دستورالعملهای کاریآشنایی مقدماتی با زبان برنامه نویسی Python (اختیاری – مزیت محسوب میشود)دارای تفکر سیستمی و نگاه فرآیندمحور با تمرکز بر بهبود مستمر
مزایای دوره کارآموزی در شرکت EIED:
فعالیت در فضای کاملاً حرفهای، پروژهمحور و مبتنی بر استانداردهای بینالمللی
متقاضیان محترم میتوانند رزومه (CV) خود را به آدرس ایمیل زیر ارسال نمایند:
poursabzi-o@eied.com
قید عبارت دقیق زیر در موضوع ایمیل الزامی است:متقاضی کارآموزی - کارآموز هوش تجاری (BI Trainee)
یامتقاضی کارآموزی - کارآموز سیستم و روشها (Systems & Methods Trainee)
از اساتید ارجمند و سایر بزرگواران تقاضا میشود این فرصت را به دانشجویان واجد شرایط معرفی نمایند.
به استحضار دانشجویان واجد شرایط نیز میرساند جذب کارآموز صرفاً با انجام مکاتبات لازم فیما بن شرکت و دانشگاه میسر خواهد بود.
این دوره شامل همکاری در پروژههای واقعی صنعتی و انتقال دانش توسط متخصصان ارشد است.
دو جایگاه کارآموزی بر اساس تخصص:
صلاحیتهای مورد نیاز:
دانشجوی رشته مهندسی صنایع، فناوری اطلاعات (IT) – از دانشگاههای سراسری مطرح تهرانتسلط به زبان برنامهنویسی Python (در سطح تحلیل داده)آشنایی با SQL (نوشتن کوئریهای ساده)مهارت در مصورسازی داده و طراحی داشبورد با Power BI (الزامی)آشنایی با اصول داستانسرایی داده (Data Storytelling)برخورداری از تفکر سیستمی و فرآیندمحور
صلاحیتهای مورد نیاز:
دانشجوی رشته مهندسی صنایع – از دانشگاههای سراسری مطرح تهرانتسلط کامل به استاندارد BPMN 2.0مهارت عملی با ابزارهای مدلسازی فرآیند Visual Paradigm، Camunda، Bizagi (حداقل یک مورد)آشنایی با مفاهیم فرآیندکاوی (Process Mining) – (آشنایی با Celonis مزیت است)توانایی مستندسازی رویههای اجرایی و نگارش دستورالعملهای کاریآشنایی مقدماتی با زبان برنامه نویسی Python (اختیاری – مزیت محسوب میشود)دارای تفکر سیستمی و نگاه فرآیندمحور با تمرکز بر بهبود مستمر
فعالیت در فضای کاملاً حرفهای، پروژهمحور و مبتنی بر استانداردهای بینالمللی
فرصت کارآموزی تخصصی – شرکت طراحی و مهندسی صنایع انرژی (EIED)شرکت EIED بعنوان یکی از شرکتهای پیشرو در حوزه پیمانکاری صنعت نفت، گاز و پتروشیمی، به منظور شناسایی جوانان مستعد و پرتلاش، ایجاد فضای رشد برای آنها و در نهایت بهرهمندی از ظرفیت توانمندیهای آنان، در حوزههای هوش تجاری (BI)، فرآیندکاوی (Process Mining) و بهسازی سیستمها و روشها از دانشجویان مستعد و هدفمند برای دوره کارآموزی حرفهای دعوت مینماید.
این دوره شامل همکاری در پروژههای واقعی صنعتی و انتقال دانش توسط متخصصان ارشد است.
دو جایگاه کارآموزی بر اساس تخصص:
صلاحیتهای مورد نیاز:
دانشجوی رشته مهندسی صنایع، فناوری اطلاعات (IT) – از دانشگاههای سراسری مطرح تهرانتسلط به زبان برنامهنویسی Python (در سطح تحلیل داده)آشنایی با SQL (نوشتن کوئریهای ساده)مهارت در مصورسازی داده و طراحی داشبورد با Power BI (الزامی)آشنایی با اصول داستانسرایی داده (Data Storytelling)برخورداری از تفکر سیستمی و فرآیندمحور
صلاحیتهای مورد نیاز:
دانشجوی رشته مهندسی صنایع – از دانشگاههای سراسری مطرح تهرانتسلط کامل به استاندارد BPMN 2.0مهارت عملی با ابزارهای مدلسازی فرآیند Visual Paradigm، Camunda، Bizagi (حداقل یک مورد)آشنایی با مفاهیم فرآیندکاوی (Process Mining) – (آشنایی با Celonis مزیت است)توانایی مستندسازی رویههای اجرایی و نگارش دستورالعملهای کاریآشنایی مقدماتی با زبان برنامه نویسی Python (اختیاری – مزیت محسوب میشود)دارای تفکر سیستمی و نگاه فرآیندمحور با تمرکز بر بهبود مستمر
فعالیت در فضای کاملاً حرفهای، پروژهمحور و مبتنی بر استانداردهای بینالمللی
متقاضیان محترم میتوانند رزومه (CV) خود را به آدرس ایمیل زیر ارسال نمایند:
قید عبارت دقیق زیر در موضوع ایمیل الزامی است:متقاضی کارآموزی - کارآموز هوش تجاری (BI Trainee)
یامتقاضی کارآموزی - کارآموز سیستم و روشها (Systems & Methods Trainee)
به استحضار دانشجویان واجد شرایط نیز میرساند جذب کارآموز صرفاً با انجام مکاتبات لازم فیما بن شرکت و دانشگاه میسر خواهد بود.
۱
۸:۳۳