
یادگیری عمیق طی چند سال گذشته تأثیر عمیقی بر شاخههای مختلف تکنولوژی داشته است. یکی از داغ ترین موضوعات در این صنعت، بینایی کامپیوتر است. رشته پردازش تصویر به طور دائم درحال گسترش و رشد است. درطول پنج سال گذشته، افزایش قابل توجهی به پردازش تصاویر و امکانات آن مانند: مورفولوژی تصویر، شبکههای عصبی، پردازش تصویر رنگی، متراکمسازی دادههای تصویر، تشخیص تصویر و سیستمهای انالیز تصویر به وجود آمده است.
به زبان ساده، می توان گفت توانایی مستقل کامپیوترها در درک تصاویر و ویدیوها نتیجه بینایی کامپیوتر است. اتومبیلهای خودران، روشهای امنیتی بیومتریک(Biometrics) و تشخیص چهره، همگی به قابلیت های بینایی کامپیوتر وابسته هستند. درواقع، هسته بینایی ماشین را پردازش تصویر تشکیل داده است.
تصویر چیست؟
تصویر از هر شکل دادهای دیگری برای درک توسط انسان ها بهتر است. بینایی به بشر این اجازه را می دهد که جهان اطراف را درک کند. درک تصویر، انالیز تصویر و بینایی کامپیوتر قصد دارد اثر بینایی انسان را بوسیله درک کامپیوتر و فهم تصویر، تکرار و تقلید کند .
پیش از آنکه به پردازش تصویر بپردازیم، ابتدا باید مبانی یک تصویر را بشناسیم. یک تصویر با ابعادش (ارتفاع و عرض) براساس تعداد پیکسلهایش مشخص میشود. به طور مثال، اگر ابعاد عکسی 500×400 (ارتفاع×عرض) باشد، مجموع تمام پیکسلهای این عکس 200 هزار پیکسل خواهد بود.
یک پیکسل، نقطهای در عکس است که سایه، کدری یا رنگ مشخصی دارد. معمولاً به یکی از شیوههای زیر وجود دارد:
- طیف خاکستری: این مشخصه در یک پیکسل دارای عددی صحیح است بین صفر تا 255 (که صفر بیانگر کاملاً مشکی و 255 بیانگر کاملاً سفید است).
- قرمز سبز آبی(RGB): هر پیکسل از سه عدد صحیح بین صفر تا 255 تشکیل شده است. (که هرکدام از اعداد صحیح بیانگر شدت رنگ قرمز، سبز و آبی هستند)
- RGBA: نسخهای توسعه یافته از RGB است که زمینه آلفا نیز به آن افزوده شده که بیانگر کدری تصویر است.
پردازش تصاویر دیجیتال نیازمند عملیاتی است که مراحل آن مشخص و ثابت باشد و بر روی هر پیکسل از عکس اعمال شود. در مرحله اول پردازش تصویر، این عملیات بصورت پیکسل به پیکسل اعمال میشود.
زمانی که این مرحله به طور کامل انجام شد، وارد مرحله دوم شده و مقادیر خروجی این عملیاتها برای هر پیکسل از عکس قابل اندازهگیری خواهد بود.
پردازش تصویر چیست؟
برای خیلی از افراد، پردازش تصاویر دیجیتالی می تواند موضوعی اضطراب آور و مشکل به نظر برسد. اما درواقع فقط چنداصل وجود دارند که شما برای استفاده از برنامههای گرافیکی باید آن ها را بدانید. فناوری دیجیتال مدرن امکان دستکاری کردن سیگنالهای چند بعدی را در سیستمهایی که از مدارهای دیجیتال ساده تا رایانههای موازی پیشرفته را شامل میشود را ممکن کرده است. بنابراین ما بر روی مفاهیم اساسی پردازش تصویر تمرکز خواهیم کرد. اما پردازش تصویر چیست؟
به فرآیند تبدیل یک عکس به فرم دیجیتال و اعمال عملیاتهایی مشخص در جهت استخراج اطلاعات از آن، “پردازش تصویر”(Image Processing) میگویند. معمولاً فرایند پردازش تصویر با همه عکسها به عنوان سیگنالهایی دوبعدی رفتار میکند و متودهای از پیش تعیینشده پردازش سیگنال را بر روی آنها اعمال میکند.
پنج نوع اصلی پردازش تصویر عبارتند از:
- تجسم: یافتن اشیائی که در تصویر قابل دیدن نیستند.
- تشخیص: تمایز قائل شدن و شناسایی اشیاء در تصویر.
- واضح ساختن و ترمیم کردن: ساختن عکسی بهبود یافته از عکس اصلی.
- شناسایی الگو: سنجیدن الگوهای مختلف در اطراف اشیاء درون عکس.
- بازیابی: جستجو کردن عکسها از پایگاه اطلاعاتی گسترده عکسهای دیجیتال که به عکس اصلی شبیه باشند.
چرا ما به پردازش تصویر دیجیتال نیازمند هستیم؟
بگذارید با یک مثال اهمیت پردازش تصویر را توضیح دهیم. همانطور که میدانیم ماهواره ابزار مفیدتری برای کسب اطلاعات در مورد جهان و همچنین سیاره زمین است. بسیاری از تصمیماتی که گرفته می شود؛ تصمیماتی هستند که مستقیماً با پیشفرضها گرفته نمیشوند؛ آن ها توسط ما و بااستفاده از تصاویر ماهوارهای گرفته شدهاند. اما تصاویرماهوارهای به فرم RGB هستند؛ از این رو باید این تصاویر را به ترکیب رنگی مناسب و همچنین فرمت مناسب پردازش تصویر انجام تبدیل کنیم. ماهوارهها این تصاویر یا هرگونه دادهای دیجیتالی که توسط کامپیوتر پردازش می شوند را ارسال می کنند. حالا تصمیم داریم؛ عناصر اولیهی پردازش تصویر و عملیاتی که بر روی تصاویر انجام می شود؛ را شرح دهیم.
مراحل پردازش تصویر
مراحل Image Processing چیست؟ پردازش تصویر دیجیتال، طیف وسیعی از سختافزار، نرم افزار و مبانی نظری را دربرمی گیرد. روش های پردازش تصویر از دو حوزه کاربردی اصلی سرچشمه می گیرند:
- بهبود دادهای تصویری برای تفسیر انسانی
- پردازش دادههای تصویری برای درک ماشین
در یک عملیات کامل Image Processing از مرحله اولیه که تصویر به یک سیستم نرم افزاری وارد می شود تا آخرین مرحله آن که به هر شئ مشخص در تصویر یک برچسب اختصاص داده می شود؛ شامل چندین مرحله می شود. مراحل پردازش تصویر دیجیتال در ادامه توضیح داده شده است.

مرحله پیش پردازش تصویر یا بهبود داده های تصویری #
• دستیابی به تصویر
اولین مرحله از فرایند پردازش تصویر، دستیابی به عکس است. همچنین از آن به عنوان مرحله پیش پردازش نیز نام برده میشود. این مرحله شامل دریافت عکس از منبعی نرمافزاری است.
برای انجام این کار به یک سنسور تصویربرداری و قابلیت دیجیتالی کردن سیگنال تولید شده توسط سنسور نیاز است. سنسور می تواند یک تلوزیون تکرنگ، رنگی و یا یک دوربین اسکنر خطی باشد. اگر خروجی دوربین تصویربرداری، یک تصویر دیجیال نباشد؛ یک مبدل آنالوگ به دیجیتال آن را دیجیتالی می کند.
•اصلاح بهبود تصویر
بهبود تصویر در واقع فرایند بیرون کشیدن و برجسته کردن برخی ویژگی های مورد نظر از یک تصویر مبهم است. اصلاح و بهبود ، عملکردیاست که به طریقی بتواند شانس موفقیت سایر فرایندهای پردازش تصویر را افزایش دهد. اصلاح و بهبود تصویر با تکنیک هایی برای افزایش کنتراست، حذف نویز و جداسازی مناطقی که ساختار آن ها احتمالاً اطلاعات عددی را نشان می دهد؛ سر و کار دارد.
• ترمیم تصویر
به فرایند بهبود ظاهر یک تصویر، ترمیم تصویر میگویند. درحالی که فرایند ترمیم تصویر، برخلاف فرایند بهبود تصویر، از مدلهای مشخص ریاضی و احتمالات استفاده میکند.
• پردازش رنگ تصویر
پردازش رنگ تصویر، تکنیکهای مدلسازی رنگ در بستر دیجیتال را شامل میشود. این مرحله به واسطه استفاده قابل توجه تصاویر دیجیتال در فضای اینترنت، برتری قابل توجهی پیدا کرده است.
• موجک ها و رزلوشنهای چندگانه
موجکها برای بیان درجات مختلف رزولوشن در تصاویر استفاده میشوند. تصاویر به موجکها یا نواحی کوچک تری برای فشردهسازی اطلاعات و همچنین برای بازنمایی هرمی تقسیمبندی میشوند.
• فشردهسازی
فرایندی که فضای لازم برای ذخیره تصویر یا پهنای باند لازم برای انتقال آن را کاهش دهد؛ فشردهسازی نام دارد. این امر به ویژه هنگامی صورت می پذیرد که تصویر برای آپلود در فضای اینترنت استفاده می شود.
• پردازش ریختشناسانه یا مورفولوژیکی
پردازش ریختشناسانه، مجموعهای از عملیات پردازش تصویر است که تصاویر را براساس شکلشان، قدم به قدم دگرگون میکند.
مرحله پیش پردازش تصویر یا بهبود داده های تصویری #
• تقسیمبندی
تقسیمبندی یکی از دشوارترین مراحل پردازش تصویر است. این فرایند شامل تقسیم بندی یک تصویر به اجزای تشکیل دهنده آن میشود.
یک روش تقسیمبندی مستحکم روند را بسوی راهحل موفقیتآمیز یک مشکل تصویربرداری سوق میدهد. الگوریتمهای تقسیمبندی ضعیف یا نامنظم تقریباً همیشه به شکست منجر می شوند. نقش کلیدی تقسیمبندی، استخراج شخصیتها و کلمات فردی از پسزمینه است.
• نمایش و تشریح
پس از آنکه تصویر در مرحله تقسیمبندی به بخش های مشخصی تقسیم شد؛ هرکدام از بخش ها به شکلی که برای پردازش کامپیوتر در مراحل بعدی مناسب باشد، تشریح و ارائه میشود. باید روشی برای توصیف داده ها مشخص شود تا ویژگی های مدنظر نمایان شوند. تشریح با استخراج اطلاعات کمّی که به تمایز میان دستههای اشیاء کمک میکند؛ سروکار دارد.
• تشخیص
در این مرحله باید روشی برای توصیف داده ها مشخص شود تا ویژگی های مدنظر نمایان شوند. سپس به هر شیء با توجه به توصیف آن، برچسبی اختصاص میدهد.
کاربردهای پردازش تصویر
از جمله کاربردهای پردازش تصویر می توان به هوش مصنوعی، بینایی ماشین و درنهایت به صنایع متأثر از این فناوری ها مانند: ترمیم تصاویر پزشکی، تکنولوژی های سنجش ترافیک، بازسازی تصویر و تشخیص چهره اشاره کرد.
برای مطالعه بیشتر درباره کاربردهای پردازش تصویر کلیک کنید.
• ترمیم تصویر پزشکی #
پردازش تصویر دیجیتال، به طور ویژه ای در تحقیقات پزشکی مورد استفاده قرار می گیرد و باعث دسترسی به راهکارهای مفیدتر و دقیقتر درمانی شده است.
به طور مثال، الگوریتمهای پیشرفته پردازش تصویر پزشکی، در تشخیص غدد کوچک سرطانی و در نهایت در تشخیص زودهنگام سرطان سینه کمک می کند.
• پردازش تصویر صنعتی #
پیشرفتهای تکنولوژی پردازش تصویر صنعتی منجر به رونق و کیفیت تولید در بیشتر کاربردهای صنعتی آن شده است. به طور مثال، پایش برخی شرایط محیطی در صنایع هوافضا یا ساخت و تولید میتواند سخت یا خطرناک باشد. بینایی ماشین میتواند جایگزین مناسبی برای بازرسی انسانی باشد.

از آنجا که در استفاده های پزشکی لازم است از پردازشهای تصویر پیشرفته استفاده شود؛ داده های تصاویر پزشکی نیازمند ارزیابی و سنجش دقیق و تخصصی هستند.
• فناوری سنجش ترافیک #
در سیستم دوربین های ترافیک، از سیستم پردازش تصویر ویدیو یا VIPS استفاده می شود. این سیستم شامل موارد زیر است:
- سیستمی برای ضبط تصویر
- سیستم ارتباط از راه دور
- سیستم پردازش تصویر
در هنگام ضبط ویدیو، سیستم Image Priocessing، از بخش های مختلفی تشکیل شده است که با ورود هر وسیله نقلیه به تصویر، سیگنال “روشن” را به خروجی سیستم میدهد و با خروج وسیله نقلیه از تصویر، سیگنال “خاموش” را به خروجی ارسال می کند.

بخش های تشخیصدهنده میتواند با چندین لنز تنظیم شود و برای ارزیابی ترافیک در مکان مشخصی مورد استفاده قرار گیرد.
از طرف دیگر، این سیستم میتواند به طور خودکار شماره پلاک اتومبیلها را ضبط کند، بین انواع وسایل نقلیه تمایز قائل شود، سرعت خودرو ها را بررسی کند و همچنین دارای استفادههای متعدد دیگری باشد.
• بازسازی تصویر #
پردازش تصویر دیجیتال میتواند در بازیابی و ترمیم قسمت های از دست رفته تصاویر مفید باشد. برای این منظور، نیاز به سیستمهای پردازش تصویری است که با پایگاههای اطلاعات تصاویر موجود آموزش دیده باشند تا بتوانند نسخههای جدیدتری از تصاویر قدیمی و آسیبدیده را بسازند.
• تشخیص چهره #
یکی از مرسومترین کاربردهای پردازش تصویر که امروزه استفاده میشود؛ تشخیص چهره است. این فرایند الگوریتمهای یادگیری عمیق را دنبال میکند که در آغاز، کامپیوتر با ویژگیهای چهره انسان مثل شکل صورت، فاصله بین دو چشم و … آشنا میشود.

پس از آموختن ویژگیهای چهره انسان توسط ماشین، شروع به شناخت تصاویر مشابه صورت انسان میکند. تشخیص چهره ابزاری ضروری در حوزه امنیت، بیومتریک و حتی فیلترهای بکار رفته در اغلب شبکههای اجتماعی است.
مزایای پردازش تصویر
در اینجا برخی از مزایای پردازش تصویر، فارغ از حوزه کاری آورده شده است:
- تهیه تصاویر دیجیتال در طیف وسیعی از فرمت ها(تصویر بهبود یافته، اشعه ایکس، عکس نگاتیو و …)
- کمک به تفسیر تصاویر توسط انسان
- استخراج و پردازش اطلاعات از تصاویر برای تفسیر توسط کامپیوتر
- تغییر و دستکاری پیکسلهای تصاویر برای دستیابی به تراکم و کنتراست دلخواه
- امکان ذخیره و بازیابی سادهتر تصاویر
- امکان انتقال سادهتر تصاویر
نتیجه گیری
رشد تکنولوژیهای یادگیری عمیق منجر به شتاب سریع بینایی کامپیوتر در پروژههای متنباز(Open Source) شده است که این نکته باعث افزایش نیاز به ابزارهای پردازش تصویر شده است.
هر ساله تقاضای متخصصین به یادگیری عمیق با سرعت زیادی رو به افزایش بوده و نشان دهنده نیاز حوزه های مختلف به این فناوری است.
منابع
برای آشنایی بیش تر با پردازش تصویر و کلیات و مفاهیم آن به این وبسایت ها مراجعه کنید. در زیر لینک مربوط به یک وبسایت مرتبط با آثار آینده هوش مصنوعی در زندگی بشر ایجاد شده است.
دیدگاه (3)
بهزاد
15 آبان 1400اموزش نرم افزار هاي كد نويسي هم خواهيد داشت؟
فاطمه بشیری
18 آبان 1400سلام و تشکر از مطلب مفیدتون فقط اینکه مطلب رو طوری شروع کردید که گویا پردازش تصویر و یادگیری عمیق دو موضوع لاینفک هستند، در صورتی که اینگونه نیست این دو کاملا جدا بوده ولی در مسایل زیادی همپوشانی و همکاری دارند. یعنی یادگیری عمیق ، روشی از یادگیری ماشین برروی داده های ماشینی است که در بسیاری از مسایل این داده ها تصویر هستند.
از طرفی پردازش تصویر به طور کلی اعمال پردازش(هرگونه پردازش) که منجر به استخراج اطلاعات از تصویر و یا تغیر تصویر باشه گفته میشه. در این صورت اون پردازش میتونه یادگیری نباشه اصلا و فقط استخراج ماکزیمم و مینیمم یک تصویر باشه یا مثلا اصلاح تصویر باشه و اصلا برچسبی برای اشیا تصویر وجود نداشته باشه و به برچسب زنی محدود نمیشه .
این نظر من بود امیدوارم که به بهبود شما کمک کنه
امیرمحمد توحیدی
22 آبان 1400ممنون از فیدبکتون