مقدمه
الگوریتمهای هوش مصنوعی روشهایی هستند که به کامپیوترها امکان میدهند تا از دادهها یاد بگیرند و تصمیمگیریهای هوشمندانه انجام دهند. این الگوریتمها به سیستمها کمک میکنند تا وظایف سخت را به صورت خودکار انجام میدهد و به مرور زمان عملکرد خود را بهبود بخشند. در این مقاله قصد داریم به بررسی مهمترین الگوریتم هوش مصنوعی و کاربرد آن ها بپردازیم. پس برای کسب اطلاعات بیشتر با ما همراه شوید!
فهرست
الگوریتمهای هوش مصنوعی چیست و چه کاربردهایی دارد؟
مهمترین الگوریتم هوش مصنوعی که باید بشناسید!
پیگیری اخبار فناوری و اطلاعات
الگوریتمهای هوش مصنوعی چیست و چه کاربردهایی دارد؟
الگوریتمهای هوش مصنوعی (AI) روشها و فرآیندهایی هستند که به کامپیوترها امکان میدهند تا به صورت خودکار از دادهها یاد بگیرند و تصمیمگیری کنند. این الگوریتمها بر مبنای مجموعهای از قواعد و روشهای ریاضیاتی و آماری طراحی شدهاند که به سیستمها کمک میکنند تا با تحلیل دادهها، الگوها و اطلاعات مفید را استخراج کنند. برخی از رایجترین کاربردهای الگوریتمهای هوش مصنوعی عبارتند از:
سلامت
برای تشخیص بیماریها از تصاویر پزشکی (مانند MRI و X-ray)، پیشبینی روند بیماری و پیشنهاد درمان و توسعه داروهای جدید و سفارشیسازی درمانها از ابزارهای هوش مصنوعی استفاده میشود.
صنعت و تولید
برای بهینه سازی زنجیره تأمین، پیشبینی نیاز و مدیریت موجودی و کنترل کیفیت و تشخیص نقصها در خطوط تولید میتوان از هوش مصنوعی استفاده کرد.
خدمات مالی
تحلیل و پیشبینی بازارهای مالی، کشف تقلب و رفتارهای مشکوک و مشاوره مالی و مدیریت سرمایه گذاری در اموری که مربوط به مالیات میشود، از الگوریتمهای هوش مصنوعی استفاده میشود.
خدمات مشتریان
از هوش مصنوعی و الگوریتمهای آن از چتباتها و دستیارهای مجازی، تحلیل احساسات و بازخورد مشتریان و سیستمهای توصیهگر برای پیشنهاد محصولات و خدمات استفاده میشود.
حمل و نقل
خودروهای خودران و سیستمهای ناوبری هوشمند، مدیریت ترافیک و بهینه سازی مسیرها و تحلیل دادههای حمل و نقل عمومی از تکنولوژی های هوش مصنوعی برای عملکرد بهتر استفاده میشود.
بازاریابی و تبلیغات
هدف گذاری تبلیغات بر اساس تحلیل دادههای کاربر، پیش بینی رفتار مشتری و تنظیم کمپینهای بازاریابی و شخصی سازی محتوا و پیشنهادها توسط الگوریتمهای هوش مصنوعی صورت میگیرد.
این کاربردها تنها چند نمونه از زمینههایی هستند که هوش مصنوعی در آنها به کار گرفته میشود و با پیشرفت تکنولوژی، کاربردهای جدیدتری نیز به این مجموعه افزوده میشوند.
مهمترین الگوریتم هوش مصنوعی که باید بشناسید!
یادگیری ماشین (Machine Learning)
الگوریتمهای یادگیری ماشین (Machine Learning) بخشی از هوش مصنوعی هستند که به سیستمها اجازه میدهند تا از دادهها بیاموزند و تصمیمات یا پیشبینیهای هوشمندانه انجام دهند. این الگوریتمها بر اساس دادههای ورودی آموزش میبینند و به مرور زمان بهبود مییابند. یادگیری ماشین به سه دسته اصلی تقسیم میشود: یادگیری نظارت شده، یادگیری بدون نظارت و یادگیری تقویتی. هر کدام از این دستهها شامل چندین الگوریتم مختلف هستند که در ادامه به توضیح هر یک میپردازیم.
یادگیری نظارت شده (Supervised Learning)
در یادگیری نظارت شده، مدلها از دادههای برچسبدار (دادههایی که خروجی مشخصی دارند) برای یادگیری استفاده میکنند. هدف این است که مدل بتواند از دادههای آموزشی الگو بگیرد و برای دادههای جدید پیشبینی درستی انجام دهد. الگوریتمهای یادگیری نظارت شده عبارتند از:
- رگرسیون خطی (Linear Regression): برای پیشبینی یک متغیر پیوسته با استفاده از رابطه خطی بین متغیرهای مستقل و وابسته.
- رگرسیون لجستیک (Logistic Regression): برای پیشبینی احتمال وقوع یک رویداد (خروجی باینری).
- ماشینهای بردار پشتیبانی (SVM – Support Vector Machines): برای دستهبندی دادهها با استفاده از مرزهای تصمیمگیری بهینه.
- درختهای تصمیمگیری (Decision Trees): ساختارهای درختی که برای دستهبندی یا پیشبینی استفاده میشوند.
- جنگل تصادفی (Random Forest): مجموعهای از درختهای تصمیمگیری که با هم ترکیب میشوند تا پیشبینیهای دقیقتری انجام دهند.
- شبکههای عصبی مصنوعی (Artificial Neural Networks): مدلهایی که از ساختار مغز الهام گرفتهاند و برای شناسایی الگوهای پیچیده استفاده میشوند.
کاربرد الگوریتم های نظارت شده
تشخیص چهره و امنیت
باز کردن قفل گوشیها و دستگاهها: فناوری تشخیص چهره در گوشیهای هوشمند از الگوریتمهای یادگیری نظارت شده برای شناسایی و تأیید هویت کاربران استفاده میکند.
سیستمهای نظارتی: دوربینهای امنیتی با استفاده از یادگیری نظارتشده قادر به شناسایی و تشخیص چهرهها، اشیاء مشکوک و رفتارهای غیرعادی هستند.
پیشبینی و توصیهگرها
سیستمهای توصیهگر (Recommendation Systems): پلتفرمهای مختلف مانند Netflix، Amazon و Spotify از الگوریتمهای یادگیری نظارتشده برای پیشنهاد فیلمها، کتابها، موسیقیها و محصولات بر اساس تاریخچه و ترجیحات کاربر استفاده میکنند.
پیشبینیهای خرید: فروشگاههای آنلاین از یادگیری نظارت شده برای پیشبینی رفتار خرید مشتریان و پیشنهاد محصولات مرتبط استفاده میکنند.
تشخیص گفتار و پردازش زبان طبیعی
دستیارهای صوتی: دستیارهای مجازی مانند Siri، Google Assistant و Alexa از الگوریتمهای یادگیری نظارتشده برای تشخیص گفتار و درک دستورات صوتی کاربران استفاده میکنند.
ترجمه زبان: ابزارهای ترجمه مانند Google Translate از یادگیری نظارتشده برای ترجمه متون و گفتار به زبانهای مختلف بهره میبرند.
تشخیص ایمیلهای اسپم و فیشینگ
فیلترهای ایمیل: سرویسهای ایمیل مانند Gmail از الگوریتمهای یادگیری نظارت شده برای تشخیص و فیلتر کردن ایمیلهای اسپم و فیشینگ استفاده میکنند تا ایمیلهای مخرب به صندوق ورودی کاربران راه نیابند.
سلامت و پزشکی
تشخیص بیماریها: الگوریتمهای یادگیری نظارتشده در تحلیل تصاویر پزشکی (مانند MRI، CT scan و X-ray) و تشخیص بیماریها و تومورها مورد استفاده قرار میگیرند.
پیشبینی روند بیماری: مدلهای یادگیری نظارتشده برای پیشبینی پیشرفت بیماریها و اثربخشی درمانها بر اساس دادههای پزشکی بیماران استفاده میشوند.
خودروهای هوشمند و خودران
سیستمهای کمک راننده: سیستمهایی مانند ترمز اضطراری خودکار و هشدار خروج از خط از الگوریتمهای یادگیری نظارتشده برای تشخیص موانع و خطوط جاده استفاده میکنند.
خودروهای خودران: خودروهای خودران از یادگیری نظارتشده برای تشخیص اشیا، عابران پیاده، علائم راهنمایی و رانندگی و تصمیمگیریهای لحظهای استفاده میکنند
تشخیص و توصیه در حوزه مالی
تشخیص تقلب: بانکها و مؤسسات مالی از الگوریتمهای یادگیری نظارتشده برای شناسایی تراکنشهای مشکوک و تقلبی استفاده میکنند.
ارزیابی اعتبار: سیستمهای ارزیابی اعتبار از یادگیری نظارت شده برای پیشبینی احتمال بازپرداخت وامها و مدیریت ریسک اعتباری استفاده میکنند.
بازاریابی و تبلیغات هدفمند
تبلیغات آنلاین: پلتفرمهای تبلیغاتی از یادگیری نظارت شده برای تحلیل رفتار کاربران و نمایش تبلیغات هدفمند بر اساس علاقهمندیها و نیازهای آنها استفاده میکنند.
تحلیل احساسات: برندها و شرکتها از الگوریتمهای یادگیری نظارتشده برای تحلیل نظرات و بازخوردهای مشتریان در شبکههای اجتماعی و بهبود محصولات و خدمات خود بهره میبرند.
یادگیری بدون نظارت (Unsupervised Learning)
در یادگیری بدون نظارت، مدلها با استفاده از دادههای بدون برچسب به دنبال یافتن ساختارها و الگوها هستند. این نوع یادگیری برای کشف گروهها یا خوشهها در دادهها و کاهش ابعاد استفاده میشود. الگوریتمهای یادگیری بدون نظارت عبارتند از:
- خوشه بندی K-Means: دادهها را به K خوشه تقسیم میکند، به طوری که دادههای هر خوشه به هم شبیهتر باشند.
- تحلیل مؤلفههای اصلی (PCA – Principal Component Analysis): ابعاد دادهها را کاهش میدهد و ویژگیهای مهم را استخراج میکند.
- خوشه بندی سلسله مراتبی (Hierarchical Clustering): ساختارهای سلسلهمراتبی از خوشهها ایجاد میکند.
- الگوریتمهای انجمنی (Association Algorithms): کشف الگوها و قوانین ارتباط بین آیتمهای داده. مثال: الگوریتم Apriori برای تحلیل سبد خرید.
کاربرد الگوریتمهای بدون نظارت
خوشهبندی مشتریان
بازاریابی هدفمند: شرکتها از الگوریتمهای خوشه بندی مانند K-Means برای تقسیمبندی مشتریان به گروههای مشابه استفاده میکنند. این تقسیم بندی به آنها کمک میکند تا کمپینهای بازاریابی هدفمندتری ایجاد کنند و پیشنهادات ویژهای برای هر گروه ارائه دهند.
تجزیه و تحلیل شبکههای اجتماعی
تشخیص جوامع و گروهها: الگوریتمهای خوشه بندی برای شناسایی گروهها و جوامع در شبکههای اجتماعی به کار میروند. این اطلاعات میتواند برای تحلیل تعاملات کاربران و شناسایی افراد تأثیرگذار مفید باشد.
تحلیل احساسات: از الگوریتمهای یادگیری بدون نظارت برای کشف الگوهای پنهان در متنها و پستهای شبکههای اجتماعی استفاده میشود تا احساسات عمومی نسبت به یک موضوع خاص شناسایی شود.
تشخیص ناهنجاریها
امنیت سایبری: الگوریتمهای یادگیری بدون نظارت برای شناسایی رفتارهای ناهنجار و مشکوک در ترافیک شبکه به کار میروند. این الگوریتمها میتوانند حملات سایبری و نفوذهای غیرمجاز را شناسایی کنند.
تشخیص تقلب: سیستمهای مالی از یادگیری بدون نظارت برای شناسایی تراکنشهای غیرعادی و مشکوک استفاده میکنند که ممکن است نشانههایی از تقلب باشند.
کاهش ابعاد دادهها
فشرده سازی و پیشپردازش دادهها: الگوریتمهایی مانند تحلیل مؤلفههای اصلی (PCA) برای کاهش ابعاد دادهها و فشردهسازی آنها به کار میروند. این فرآیند به بهبود عملکرد الگوریتمهای یادگیری و کاهش پیچیدگی دادهها کمک میکند.
بهبود تجسم دادهها: کاهش ابعاد دادهها میتواند به تجسم بهتر دادهها و کشف الگوهای مخفی کمک کند که به فهم عمیقتر دادهها منجر میشود.
تحلیل توصیهگرها
سیستمهای توصیهگر: از یادگیری بدون نظارت برای کشف الگوهای خرید کاربران و پیشنهاد محصولات یا خدمات مرتبط استفاده میشود. به عنوان مثال، الگوریتمهای خوشهبندی میتوانند کاربران با سلیقههای مشابه را شناسایی کنند و پیشنهادات مناسبی برای آنها ارائه دهند.
تقسیمبندی تصاویر و تشخیص الگوها
تشخیص اشیا در تصاویر: الگوریتمهای خوشه بندی و تجزیه و تحلیل تصاویر برای شناسایی و دسته بندی اشیا در تصاویر به کار میروند. به عنوان مثال، در پزشکی برای شناسایی نواحی مشکوک در تصاویر MRI و CT scan استفاده میشوند.
فشردهسازی تصاویر: الگوریتمهای یادگیری بدون نظارت میتوانند برای کاهش نویز و بهبود کیفیت تصاویر ویدئویی به کار روند.
تجزیه و تحلیل سبد خرید
تحلیل انجمنی: الگوریتمهای یادگیری بدون نظارت برای کشف روابط میان محصولات خریداریشده توسط مشتریان به کار میروند. این تحلیلها به فروشگاهها کمک میکند تا پیشنهادات متقاطع و بستههای تخفیفی مناسبی ارائه دهند.
تشخیص الگوهای ترافیک
مدیریت ترافیک شهری: از الگوریتمهای یادگیری بدون نظارت برای تحلیل الگوهای ترافیکی و بهبود مدیریت ترافیک استفاده میشود. این الگوریتمها میتوانند نواحی پر ترافیک و زمانهای اوج ترافیک را شناسایی کنند.
یادگیری نیمهنظارتشده (Semi-Supervised Learning)
یادگیری نیمه نظارت شده ترکیبی از دادههای برچسبدار و بدون برچسب برای آموزش مدل است. این روش زمانی استفاده میشود که برچسب گذاری همه دادهها هزینهبر یا دشوار باشد. ترکیب الگوریتمهای نظارتشده و بدون نظارت، مانند استفاده از K-Means برای برچسب گذاری دادههای بدون برچسب و سپس استفاده از یک مدل نظارتشده برای آموزش.
کاربرد یادگیری نیمه نظارت شده
تشخیص و تحلیل گفتار
دستیارهای صوتی: دستیارهای هوشمندی مانند Siri، Google Assistant و Alexa از یادگیری نیمه نظارت شده برای بهبود دقت تشخیص گفتار استفاده میکنند. این سیستمها از دادههای برچسبدار برای آموزش اولیه و از دادههای بدون برچسب که از تعاملات کاربران به دست میآید برای بهبود مداوم مدلهای خود استفاده میکنند.
پردازش زبان طبیعی (NLP)
ترجمه خودکار: سرویسهای ترجمه مانند Google Translate از یادگیری نیمه نظارت شده برای بهبود کیفیت ترجمهها استفاده میکنند. آنها از متون برچسبدار برای آموزش اولیه و از متون بدون برچسب که توسط کاربران ارائه میشود برای بهبود مداوم سیستمها بهره میبرند.
تحلیل احساسات: پلتفرمهای تحلیل احساسات در شبکههای اجتماعی و بررسیهای آنلاین از یادگیری نیمه نظارت شده برای تشخیص دقیقتر احساسات کاربران استفاده میکنند.
تشخیص و پیشبینی در پزشکی
تشخیص بیماریها: الگوریتمهای نیمهنظارتشده میتوانند در تشخیص بیماریها از تصاویر پزشکی استفاده شوند. به عنوان مثال، تعداد محدودی از تصاویر MRI یا X-ray برچسبدار وجود دارد، اما حجم زیادی از تصاویر بدون برچسب موجود است که میتوانند به بهبود دقت مدلها کمک کنند.
پیش بینی نتایج درمانی: مدلهای نیمهنظارتشده میتوانند برای پیشبینی نتایج درمانی بیماران با استفاده از دادههای برچسبدار و بدون برچسب پزشکی به کار روند.
تشخیص تقلب
سیستمهای مالی: بانکها و موسسات مالی از یادگیری نیمه نظارت شده برای تشخیص تراکنشهای تقلبی استفاده میکنند. تعداد کمی از تراکنشها به صورت دستی بررسی و برچسبگذاری میشوند، در حالی که حجم زیادی از دادههای تراکنشهای بدون برچسب برای بهبود مدلها استفاده میشود.
خودروهای خودران
تشخیص اشیا و موانع: خودروهای خودران از الگوریتمهای نیمهنظارتشده برای تشخیص اشیا و موانع در جادهها استفاده میکنند. تعداد محدودی از تصاویر و ویدئوهای جادهای برچسبدار وجود دارد، اما حجم زیادی از دادههای بدون برچسب که از دوربینهای خودروها جمعآوری میشود، برای بهبود مدلها استفاده میشود.
سیستمهای توصیهگر
پلتفرمهای پخش موسیقی و ویدئو: سرویسهایی مانند Netflix، YouTube و Spotify از یادگیری نیمه نظارت شده برای بهبود دقت توصیههای خود استفاده میکنند. دادههای برچسبدار از تاریخچه تماشا یا گوش دادن کاربران جمعآوری میشود و دادههای بدون برچسب از رفتارهای جاری کاربران برای بهبود مدلها استفاده میشود.
توصیههای خرید: فروشگاههای آنلاین از یادگیری نیمهنظارتشده برای بهبود پیشنهادات خرید استفاده میکنند، به طوری که از دادههای محدود برچسبدار و حجم زیادی از دادههای بدون برچسب استفاده میشود.
تحلیل تصاویر و ویدئوها
تشخیص چهره و اشیا: الگوریتمهای نیمهنظارتشده در تشخیص چهره و اشیا در تصاویر و ویدئوها کاربرد دارند. دادههای برچسبدار اولیه برای آموزش مدلها و دادههای بدون برچسب برای بهبود دقت و عملکرد مدلها استفاده میشوند.
امنیت و نظارت: سیستمهای امنیتی از یادگیری نیمه نظارت شده برای تشخیص فعالیتهای مشکوک در ویدئوهای نظارتی استفاده میکنند.
آموزش و یادگیری آنلاین
سیستمهای آموزش الکترونیکی: پلتفرمهای آموزش آنلاین از یادگیری نیمهنظارتشده برای بهبود تجربه یادگیری کاربران استفاده میکنند. دادههای برچسب دار از پاسخهای دانشجویان به آزمونها و تمرینات جمعآوری میشود و دادههای بدون برچسب از تعاملات روزانه دانشجویان با پلتفرمها برای بهبود مدلها استفاده میشود.
یادگیری تقویتی (Reinforcement Learning)
در یادگیری تقویتی، عامل (agent) با محیط تعامل میکند و از طریق آزمون و خطا به بهبود عملکرد خود میپردازد. هدف این است که عامل یاد بگیرد چگونه اقداماتی انجام دهد که بیشترین پاداش را در طولانیمدت به همراه داشته باشد. الگوریتمهای یادگیری تقویتی عبارتند از:
- Q-Learning: الگوریتمی که به عامل کمک میکند تا ارزشهای اقدامهای مختلف را در هر وضعیت یاد بگیرد.
- شبکههای عصبی عمیق Q (Deep Q-Networks): ترکیبی از Q-Learning و شبکههای عصبی عمیق برای حل مسائل پیچیدهتر.
- سیاستهای گرادیان (Policy Gradient): الگوریتمهایی که سیاستهای عامل را بهبود میبخشند تا پاداشهای بیشتری کسب کنند.
کاربرد الگوریتمهای تقویتی
بازیها و سرگرمیها
بازیهای کامپیوتری: الگوریتمهای یادگیری تقویتی در طراحی هوش مصنوعی برای بازیهای کامپیوتری استفاده میشوند. به عنوان مثال، هوش مصنوعی AlphaGo شرکت DeepMind از یادگیری تقویتی برای یادگیری و برنده شدن در بازی Go استفاده کرده است.
بازیهای ویدئویی: هوش مصنوعی در بازیهای ویدئویی برای تصمیمگیری و بهبود تجربه بازی بازیکنان از یادگیری تقویتی بهره میبرد.
تجارت و بازارهای مالی
معاملات الگوریتمی: در بازارهای مالی، الگوریتمهای یادگیری تقویتی برای توسعه استراتژیهای معاملات الگوریتمی استفاده میشوند که با تحلیل دادههای بازار و پیشبینی روندها به حداکثر سود دست یابند.
مدیریت پورتفولیو: الگوریتمهای یادگیری تقویتی برای مدیریت پورتفولیو و بهینه سازی ترکیب داراییها با توجه به ریسک و بازده استفاده میشوند.
رباتیک
رباتهای خانگی: رباتهای خانگی مانند جاروبرقیهای هوشمند از یادگیری تقویتی برای بهبود مسیر حرکت و تمیز کردن کارآمدتر خانه استفاده میکنند.
رباتهای صنعتی: در کارخانهها، رباتها از یادگیری تقویتی برای بهبود فرآیندهای تولید، مونتاژ و کنترل کیفیت استفاده میکنند.
مدیریت منابع و انرژی
بهینهسازی مصرف انرژی: سیستمهای مدیریت انرژی در ساختمانها و شبکههای برق از یادگیری تقویتی برای بهینهسازی مصرف انرژی و کاهش هزینهها استفاده میکنند.
مدیریت منابع آب: الگوریتمهای یادگیری تقویتی در سیستمهای مدیریت منابع آب برای بهینهسازی مصرف و توزیع آب به کار میروند.
آموزش و پرورش
سیستمهای آموزش الکترونیکی: پلتفرمهای آموزش آنلاین از یادگیری تقویتی برای شخصی سازی مسیرهای یادگیری و پیشنهاد منابع آموزشی مناسب برای هر دانش آموز استفاده میکنند.
تدریس تعاملی: ابزارهای تدریس تعاملی از یادگیری تقویتی برای بهبود روشهای تدریس و تعامل با دانشآموزان بهره میبرند.
تشخیص و پیشگیری از بیماریها
پزشکی: الگوریتمهای یادگیری تقویتی برای پیشبینی بیماریها و پیشنهاد برنامههای درمانی استفاده میشوند.
کنترل دیابت: سیستمهای مدیریت دیابت از یادگیری تقویتی برای پیشنهاد رژیمهای غذایی و دارویی مناسب به بیماران استفاده میکنند.
پیگیری اخبار فناوری و اطلاعات
یکی از شرکتهای معتبر و باسابقه که به انتشار اخبار، مقالات و رویدادهای حوزه فناوری و اطلاعات میپردازد، ایرانتک است. شما عزیزان میتوانید برای کسب اطلاعات بیشتر در این حوزه، با مراجعه روزانه به سایت اطلاعات بیشتری را به دست آورید.
کلام پایانی
الگوریتم هوش مصنوعی مجموعهای از دستورالعملها و الگوریتمهایی است که به کامپیوترها امکان میدهد تا از دادهها یاد بگیرند، الگوها را شناسایی کرده و تصمیمات هوشمندانهای را اتخاذ کنند. این الگوریتمها برای حل مسائل سخت و تصمیمگیریهای مبتنی بر اطلاعات در زمینههای مختلف مورد استفاده قرار میگیرند. در این مقاله به طور کامل به بررسی مهمترین الگوریتم هوش مصنوعی و کاربرد هر کدام پرداختیم. شما عزیزان میتوانید سوالات خود را در این زمینه با ما در میان بگذارید.
سوالات متداول
1. مهمترین الگوریتمهای هوش مصنوعی چگونه کار میکنند؟
الگوریتمهای هوش مصنوعی با تحلیل دادهها و یادگیری الگوها از آنها، به سیستمها امکان میدهند تا تصمیمات هوشمندانه بگیرند. این الگوریتمها به سه دسته اصلی یادگیری نظارت شده، یادگیری بدون نظارت و یادگیری تقویتی تقسیم میشوند که هر کدام روش خاصی برای یادگیری و پیشبینی دارند.
2. تفاوت بین یادگیری نظارتشده و بدون نظارت چیست؟
در یادگیری نظارتشده، مدلها با دادههای برچسبدار (دادههایی که همراه با نتایج صحیح هستند) آموزش میبینند تا بتوانند برای دادههای جدید پیشبینی کنند. در یادگیری بدون نظارت، مدلها بدون استفاده از اطلاعات برچسبدار کار میکنند و هدف آنها یافتن الگوها و ساختارهای مخفی در اطلاعات است.
3. یادگیری تقویتی در چه مواردی استفاده میشود؟
یادگیری تقویتی در مواردی استفاده میشود که یک عامل باید از طریق تعامل با محیط و دریافت پاداش یا تنبیه، به تصمیمگیری بهینه برسد. این روش در بازیهای ویدئویی، خودروهای خودران و رباتیک کاربرد دارد، جایی که عامل باید از طریق آزمایش و خطا یاد بگیرد.