پردازش تصویر چیست؟ تعریف، کاربردها و فواید

پردازش تصویر چیست؟ تعریف، کاربردها و فواید

یادگیری عمیق طی چند سال گذشته تأثیر عمیقی بر شاخه‌های مختلف تکنولوژی داشته است. یکی از داغ ترین موضوعات در این صنعت، بینایی کامپیوتر است. رشته پردازش تصویر به طور دائم درحال گسترش و رشد است. درطول پنج سال گذشته، افزایش قابل توجهی به پردازش تصاویر و امکانات آن مانند: مورفولوژی تصویر، شبکه‌های عصبی، پردازش تصویر رنگی، متراکم‌سازی داده‌های تصویر، تشخیص تصویر و سیستم‌های انالیز تصویر به­­ وجود آمده است.

به زبان ساده، می­ توان گفت توانایی مستقل کامپیوترها در درک تصاویر و ویدیوها نتیجه بینایی کامپیوتر است. اتومبیل‌های خودران، روش‌های امنیتی بیومتریک(Biometrics) و تشخیص چهره، همگی به قابلیت ­های بینایی کامپیوتر وابسته هستند. درواقع، هسته بینایی ماشین را پردازش تصویر تشکیل داده است.

تصویر چیست؟

تصویر از هر شکل دادهای دیگری برای درک توسط انسان­ ها بهتر است. بینایی به بشر این اجازه را می دهد که جهان اطراف را درک کند. درک تصویر، انالیز تصویر و بینایی کامپیوتر قصد دارد اثر بینایی انسان  را بوسیله درک کامپیوتر و فهم تصویر، تکرار و تقلید کند .

پیش از آنکه به پردازش تصویر بپردازیم، ابتدا باید مبانی یک تصویر را بشناسیم. یک تصویر با ابعادش (ارتفاع و عرض) براساس تعداد پیکسل‌هایش مشخص می‌شود. به طور مثال، اگر ابعاد عکسی 500×400 (ارتفاع×عرض) باشد، مجموع تمام پیکسل‌های این عکس 200 هزار پیکسل خواهد بود.

یک پیکسل، نقطه‌ای در عکس است که سایه، کدری یا رنگ مشخصی دارد. معمولاً به یکی از شیوه‌های زیر وجود دارد:

  • طیف خاکستری: این مشخصه در یک پیکسل دارای عددی صحیح است بین صفر تا 255 (که صفر بیانگر کاملاً مشکی و 255 بیانگر کاملاً سفید است).
  • قرمز سبز آبی(RGB): هر پیکسل از سه عدد صحیح بین صفر تا 255 تشکیل شده است. (که هرکدام از اعداد صحیح بیانگر شدت رنگ قرمز، سبز و آبی هستند)
  • RGBA: نسخه‌ای توسعه یافته از RGB است که زمینه آلفا نیز به آن افزوده شده که بیانگر کدری تصویر است.

پردازش تصاویر دیجیتال نیازمند عملیاتی است که مراحل آن مشخص و ثابت باشد و بر روی هر پیکسل از عکس اعمال ­شود. در مرحله اول پردازش تصویر، این عملیات بصورت پیکسل به پیکسل اعمال می‌شود.

 زمانی که این مرحله به طور کامل انجام شد، وارد مرحله دوم شده و مقادیر خروجی این عملیات‌ها برای هر پیکسل از عکس قابل اندازه‌گیری خواهد بود.

پردازش تصویر چیست؟

برای خیلی از افراد، پردازش تصاویر دیجیتالی می ­تواند موضوعی اضطراب­ آور و مشکل به ­نظر برسد. اما درواقع فقط چنداصل وجود دارند که شما برای استفاده از برنامه‌های گرافیکی باید آن ها را بدانید. فناوری دیجیتال مدرن امکان دستکاری کردن سیگنال‌های چند بعدی را در سیستم‌هایی که از مدارهای دیجیتال ساده تا رایانه‌های موازی پیشرفته را شامل می‌شود را ممکن کرده است. بنابراین ما بر روی مفاهیم اساسی  پردازش تصویر تمرکز خواهیم کرد. اما پردازش تصویر چیست؟

به فرآیند تبدیل یک عکس به فرم دیجیتال و اعمال عملیات‌هایی مشخص در جهت استخراج اطلاعات از آن، “پردازش تصویر”(Image Processing) می‌گویند. معمولاً فرایند پردازش تصویر با همه عکس‌ها به عنوان سیگنال‌هایی دوبعدی رفتار می‌کند و متودهای از پیش تعیین‌شده پردازش سیگنال را بر روی آن‌ها اعمال می‌کند.

پنج نوع اصلی پردازش تصویر عبارتند از:

  • تجسم: یافتن اشیائی که در تصویر قابل دیدن نیستند.
  • تشخیص: تمایز قائل شدن و شناسایی اشیاء در تصویر.
  • واضح ساختن و ترمیم کردن: ساختن عکسی بهبود یافته از عکس اصلی.
  • شناسایی الگو: سنجیدن الگوهای مختلف در اطراف اشیاء درون عکس.
  • بازیابی: جستجو کردن عکس‌ها از پایگاه اطلاعاتی گسترده عکس‌های دیجیتال که به عکس اصلی شبیه باشند.

چرا ما به پردازش تصویر دیجیتال نیازمند هستیم؟

بگذارید با یک مثال اهمیت پردازش تصویر را توضیح دهیم. همانطور که می‌دانیم ماهواره ابزار مفیدتری برای کسب اطلاعات در مورد جهان و همچنین سیاره زمین است. بسیاری از تصمیماتی که گرفته می­ شود؛ تصمیماتی هستند که مستقیماً با پیش‌فرض‌ها گرفته نمی‌شوند؛ آن ها توسط ما و بااستفاده از تصاویر ماهواره‌ای گرفته شده‌اند. اما تصاویرماهواره‌ای به فرم RGB هستند؛ از این رو باید این تصاویر را به ترکیب رنگی مناسب و همچنین فرمت مناسب پردازش تصویر انجام تبدیل کنیم. ماهواره‌ها این تصاویر یا هرگونه داده‌ای دیجیتالی که توسط کامپیوتر پردازش می­ شوند را ارسال می ­کنند. حالا تصمیم داریم؛ عناصر اولیه‌ی پردازش تصویر و عملیاتی که بر روی تصاویر انجام می­ شود؛ را شرح دهیم.

مراحل پردازش تصویر

مراحل Image Processing چیست؟ پردازش تصویر دیجیتال، طیف وسیعی از سخت‌افزار، نرم افزار و مبانی نظری را دربرمی­ گیرد. روش­ های پردازش تصویر از دو حوزه کاربردی اصلی سرچشمه می گیرند:

  • بهبود داد‌های تصویری برای تفسیر انسانی
  • پردازش داده‌های تصویری برای درک ماشین

در یک عملیات کامل Image Processing از مرحله اولیه که تصویر به یک سیستم نرم­ افزاری وارد می ­شود تا آخرین مرحله آن که به هر شئ مشخص در تصویر یک برچسب اختصاص داده می ­شود؛ شامل چندین مرحله می ­شود. مراحل پردازش تصویر دیجیتال در ادامه توضیح داده شده است.

مرحله پیش پردازش تصویر یا بهبود داده های تصویری #

• دستیابی به تصویر

اولین مرحله از فرایند پردازش تصویر، دستیابی به عکس است. همچنین از آن به عنوان مرحله پیش­ پردازش نیز نام برده می‌شود. این مرحله شامل دریافت عکس از منبعی نرم‌افزاری است.

برای انجام این کار به یک سنسور تصویربرداری و قابلیت دیجیتالی کردن سیگنال تولید شده توسط سنسور نیاز است. سنسور می تواند یک تلوزیون تک‌رنگ، رنگی و یا یک دوربین اسکنر خطی باشد. اگر خروجی دوربین تصویربرداری، یک تصویر دیجیال نباشد؛ یک مبدل آنالوگ به دیجیتال آن را دیجیتالی می کند.

•اصلاح بهبود تصویر

بهبود تصویر در واقع فرایند بیرون کشیدن و برجسته کردن برخی ویژگی­ های مورد نظر از یک تصویر مبهم است. اصلاح و بهبود ، عملکردی‌است که به ­طریقی بتواند شانس موفقیت سایر فرایندهای پردازش تصویر را افزایش دهد. اصلاح و بهبود تصویر با تکنیک هایی برای افزایش کنتراست، حذف نویز و جداسازی مناطقی که ساختار آن ها احتمالاً اطلاعات عددی را نشان می دهد؛ سر و کار دارد.

• ترمیم تصویر

به فرایند بهبود ظاهر یک تصویر، ترمیم تصویر می‌گویند. درحالی که فرایند ترمیم تصویر، برخلاف فرایند بهبود تصویر،  از مدل‌های مشخص ریاضی و احتمالات استفاده می‌کند.

• پردازش رنگ تصویر

پردازش رنگ تصویر، تکنیک‌های مدلسازی رنگ در بستر دیجیتال را شامل می‌شود. این مرحله به واسطه استفاده قابل توجه تصاویر دیجیتال در فضای اینترنت، برتری قابل توجهی پیدا کرده است.

• موجک ها و رزلوشن‌های چندگانه

موجک‌ها برای بیان درجات مختلف رزولوشن در تصاویر استفاده می‌شوند. تصاویر به موجک‌ها یا نواحی کوچک تری برای فشرده‌سازی اطلاعات و همچنین برای بازنمایی هرمی تقسیم‌بندی می‌شوند.

• فشرده‌سازی

فرایندی که فضای لازم برای ذخیره تصویر یا پهنای باند لازم برای انتقال آن را کاهش دهد؛ فشرده‌سازی نام دارد. این امر به ویژه هنگامی صورت می­ پذیرد که تصویر برای آپلود در فضای اینترنت استفاده می­ شود.

• پردازش ریخت‌شناسانه یا مورفولوژیکی

پردازش ریخت‌شناسانه، مجموعه‌ای از عملیات پردازش تصویر است که تصاویر را براساس شکل‌شان، قدم به قدم دگرگون می‌کند.

مرحله پیش پردازش تصویر یا بهبود داده های تصویری #

• تقسیم‌بندی

تقسیم‌بندی یکی از دشوارترین مراحل پردازش تصویر است. این فرایند شامل تقسیم ­بندی یک تصویر به اجزای تشکیل دهنده آن می‌شود.

 یک روش تقسیم‌بندی مستحکم روند را بسوی راه‌حل موفقیت‌آمیز یک مشکل تصویربرداری سوق می‌دهد. الگوریتم‌های تقسیم‌بندی ضعیف یا نامنظم تقریباً همیشه به شکست منجر می ­شوند. نقش کلیدی تقسیم‌بندی، استخراج شخصیت‌ها و کلمات فردی از پس‌زمینه است.

• نمایش و تشریح

پس از آنکه تصویر در مرحله تقسیم‌بندی به بخش­ های مشخصی تقسیم شد؛ هرکدام از بخش­ ها به شکلی که برای پردازش کامپیوتر در مراحل بعدی مناسب باشد، تشریح و ارائه می‌شود. باید روشی برای توصیف داده ها مشخص شود تا ویژگی های مدنظر نمایان شوند. تشریح با استخراج اطلاعات کمّی که به تمایز میان دسته‌های اشیاء کمک می‌کند؛ سروکار دارد.

• تشخیص

در این مرحله باید روشی برای توصیف داده ها مشخص شود تا ویژگی های مدنظر نمایان شوند. سپس  به هر شیء با توجه به توصیف آن، برچسبی اختصاص می‌دهد.

کاربردهای پردازش تصویر

از جمله کاربرد­های پردازش تصویر می­ توان به هوش مصنوعی، بینایی ماشین و درنهایت به صنایع متأثر از این فناوری ها مانند: ترمیم تصاویر پزشکی، تکنولوژی های سنجش ترافیک، بازسازی تصویر و تشخیص چهره اشاره کرد.

برای مطالعه بیشتر درباره  کاربردهای پردازش تصویر کلیک کنید.

• ترمیم تصویر پزشکی #

پردازش تصویر دیجیتال، به­ طور ویژه ­ای در تحقیقات پزشکی مورد استفاده قرار می ­گیرد و باعث دسترسی به راهکارهای مفیدتر و دقیق‌تر درمانی شده است.

 به طور مثال، الگوریتم‌های پیشرفته پردازش تصویر پزشکی، در تشخیص غدد کوچک سرطانی و در نهایت در تشخیص زودهنگام سرطان سینه کمک می­ کند.

• پردازش تصویر صنعتی #

پیشرفت‌های تکنولوژی پردازش تصویر صنعتی منجر به رونق و کیفیت تولید در بیشتر کاربردهای صنعتی آن شده است. به طور مثال، پایش برخی شرایط محیطی در صنایع هوافضا یا ساخت و تولید می‌تواند سخت یا خطرناک باشد. بینایی ماشین  می‌تواند جایگزین مناسبی برای بازرسی انسانی باشد.

از آنجا که در استفاده­ های پزشکی لازم است از پردازش‌های تصویر پیشرفته استفاده شود؛ داده­ های تصاویر پزشکی نیازمند ارزیابی و سنجش دقیق و تخصصی هستند.

• فناوری‌ سنجش ترافیک #

در سیستم دوربین­ های ترافیک، از سیستم پردازش تصویر ویدیو یا VIPS استفاده می­ شود. این سیستم شامل موارد زیر است:

  • سیستمی برای ضبط تصویر
  • سیستم ارتباط از راه دور
  • سیستم پردازش تصویر

در هنگام ضبط ویدیو، سیستم Image Priocessing، از بخش ­های مختلفی تشکیل شده است که با ورود هر وسیله نقلیه به تصویر، سیگنال “روشن” را به خروجی سیستم می‌دهد و با خروج وسیله نقلیه از تصویر، سیگنال “خاموش” را به خروجی ارسال می ­کند.

بخش ­های تشخیص‌دهنده می‌تواند با چندین لنز تنظیم شود و برای ارزیابی ترافیک در مکان مشخصی مورد استفاده قرار گیرد.

از طرف دیگر، این سیستم می‌تواند به طور خودکار شماره پلاک اتومبیل‌ها را ضبط کند، بین انواع وسایل نقلیه تمایز قائل شود، سرعت خودرو ها را بررسی کند و همچنین دارای استفاده‌های متعدد دیگری باشد.

• بازسازی تصویر #

پردازش تصویر دیجیتال می‌تواند در بازیابی و ترمیم قسمت­ های از دست رفته تصاویر مفید باشد. برای این منظور، نیاز به سیستم‌های پردازش تصویری است که با پایگاه‌های اطلاعات تصاویر موجود آموزش دیده باشند تا بتوانند نسخه‌های جدیدتری از تصاویر قدیمی و آسیب‌دیده را بسازند.

• تشخیص چهره #

یکی از مرسوم‌ترین کاربردهای پردازش تصویر که امروزه استفاده می‌شود؛ تشخیص چهره است. این فرایند الگوریتم‌های یادگیری عمیق را دنبال می‌کند که در آغاز، کامپیوتر با ویژگی‌های چهره انسان مثل شکل صورت، فاصله بین دو چشم و … آشنا می‌شود.

 پس از آموختن ویژگی‌های چهره انسان توسط ماشین، شروع به شناخت تصاویر مشابه صورت انسان می‌کند. تشخیص چهره ابزاری ضروری در حوزه امنیت، بیومتریک و حتی فیلترهای بکار رفته در اغلب شبکه‌های اجتماعی است.

مزایای پردازش تصویر

در اینجا برخی از مزایای پردازش تصویر، فارغ از حوزه کاری آورده شده است:

  • تهیه تصاویر دیجیتال در طیف وسیعی از فرمت ­ها(تصویر بهبود یافته، اشعه ایکس، عکس نگاتیو و …)
  • کمک به تفسیر تصاویر توسط انسان
  • استخراج و پردازش اطلاعات از تصاویر برای تفسیر توسط کامپیوتر
  • تغییر و دستکاری پیکسل‌های تصاویر برای دستیابی به تراکم و کنتراست دلخواه
  • امکان ذخیره و بازیابی ساده‌تر تصاویر
  • امکان انتقال ساده‌تر تصاویر

نتیجه گیری

رشد تکنولوژی‌های یادگیری عمیق منجر به شتاب سریع بینایی کامپیوتر در پروژه‌های متن‌باز(Open Source) شده است که این نکته باعث افزایش نیاز به ابزارهای پردازش تصویر شده است.

 هر ساله تقاضای متخصصین به یادگیری عمیق با سرعت زیادی رو به افزایش بوده و نشان دهنده نیاز حوزه ­های مختلف به این فناوری است.

منابع

برای آشنایی بیش تر با پردازش تصویر و کلیات و مفاهیم آن به  این وبسایت ها مراجعه کنید. در زیر لینک مربوط به یک وبسایت مرتبط با آثار آینده هوش مصنوعی در زندگی بشر ایجاد شده است.

لینک کوتاه این مقاله:
امیرمحمد توحیدی
امیرمحمد توحیدی

دیدگاه (3)

  1. بهزاد
    15 آبان 1400

    اموزش نرم افزار هاي كد نويسي هم خواهيد داشت؟

  2. فاطمه بشیری
    18 آبان 1400

    سلام و تشکر از مطلب مفیدتون فقط اینکه مطلب رو طوری شروع کردید که گویا پردازش تصویر و یادگیری عمیق دو موضوع لاینفک هستند، در صورتی که اینگونه نیست این دو کاملا جدا بوده ولی در مسایل زیادی همپوشانی و همکاری دارند. یعنی یادگیری عمیق ، روشی از یادگیری ماشین برروی داده های ماشینی است که در بسیاری از مسایل این داده ها تصویر هستند.
    از طرفی پردازش تصویر به طور کلی اعمال پردازش(هرگونه پردازش) که منجر به استخراج اطلاعات از تصویر و یا تغیر تصویر باشه گفته میشه. در این صورت اون پردازش میتونه یادگیری نباشه اصلا و فقط استخراج ماکزیمم و مینیمم یک تصویر باشه یا مثلا اصلاح تصویر باشه و اصلا برچسبی برای اشیا تصویر وجود نداشته باشه و به برچسب زنی محدود نمیشه .
    این نظر من بود امیدوارم که به بهبود شما کمک کنه

    • امیرمحمد توحیدی
      22 آبان 1400

      ممنون از فیدبکتون

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد.