پردازش تصویر چیست: تعریف، کاربردها و فواید

پردازش تصویر چیست: تعریف، کاربردها و فواید

یادگیری عمیق طی چند سال گذشته تأثیر عمیقی بر شاخه‌های مختلف تکنولوژی داشته است. یکی از داغترین موضوعات در این صنعت، بینایی کامپیوتر است.

به زبان ساده، می­توان گفت توانایی مستقل کامپیوترها در درک تصاویر و ویدیوها نتیجه بینایی کامپیوتر است. اتومبیل‌های خودران، روش‌های امنیتی بیومتریک(Biometrics) و تشخیص چهره، همگی به قابلیت­های بینایی کامپیوتر وابسته هستند. درواقع، هسته بینایی ماشین را پردازش تصویر تشکیل داده است.

تصویر چیست؟ #

پیش از آنکه به پردازش تصویر بپردازیم، ابتدا باید مبانی یک تصویر را بشناسیم. یک تصویر با ابعادش (ارتفاع و عرض) براساس تعداد پیکسل‌هایش مشخص می‌شود. به طور مثال، اگر ابعاد عکسی 500×400 (ارتفاع×عرض) باشد، مجموع تمام پیکسل‌های این عکس 200 هزار پیکسل خواهد بود.

یک پیکسل، نقطه‌ای در عکس است که سایه، کدری یا رنگ مشخصی دارد. معمولاً به یکی از شیوه‌های زیر وجود دارد:

  • طیف خاکستری: این مشخصه در یک پیکسل دارای عددی صحیح است بین صفر تا 255 (که صفر بیانگر کاملاً مشکی و 255 بیانگر کاملاً سفید است).
  • قرمز سبز آبی(RGB): هر پیکسل از سه عدد صحیح بین صفر تا 255 تشکیل شده است. (که هرکدام از اعداد صحیح بیانگر شدت رنگ قرمز، سبز و آبی هستند)
  • RGBA: نسخه‌ای توسعه یافته از RGB است که زمینه آلفا نیز به آن افزوده شده که بیانگر کدری تصویر است.

پردازش تصویر نیازمند عملیاتی است که مراحل آن مشخص و ثابت باشد و بر روی هر پیکسل از عکس اعمال ­شود. در مرحله اول پردازش تصویر، این عملیات بصورت پیکسل به پیکسل اعمال می‌شود.

 زمانی که این مرحله به طور کامل انجام شد، وارد مرحله دوم شده و مقادیر خروجی این عملیات‌ها برای هر پیکسل از عکس قابل اندازه‌گیری خواهد بود.

پردازش تصویر چیست؟ #

به فرآیند تبدیل یک عکس به فرم دیجیتال و اعمال عملیات‌هایی مشخص در جهت استخراج اطلاعات از آن، “پردازش تصویر”(Image Processing) می‌گویند. معمولاً فرایند پردازش تصویر با همه عکس‌ها به عنوان سیگنال‌هایی دوبعدی رفتار می‌کند و متودهای از پیش تعیین‌شده پردازش سیگنال را بر روی آن‌ها اعمال می‌کند.

پنج نوع اصلی پردازش تصویر عبارتند از:

  • تجسم: یافتن اشیائی که در تصویر قابل دیدن نیستند
  • تشخیص: تمایز قائل شدن و شناسایی اشیاء در تصویر
  • واضح ساختن و ترمیم کردن: ساختن عکسی بهبودیافته از عکس اصلی
  • شناسایی الگو: سنجیدن الگوهای مختلف در اطراف اشیاء درون عکس
  • بازیابی: جستجو کردن عکس‌ها از پایگاه اطلاعاتی گسترده عکس‌های دیجیتال که به عکس اصلی شبیه باشند

مراحل پردازش تصویر #

در یک عملیات کامل پردازش تصویر از مرحله اولیه که تصویر به یک سیستم نرم­افزاری وارد می­شود تا آخرین مرحله آن که به هر شئ مشخص در تصویر یک برچسب اختصاص داده می­شود؛ شامل ده مرحله می­شود. مراحل پردازش تصویر در ادامه توضیح داده شده است.

• دستیابی به تصویر

اولین مرحله از فرایند پردازش تصویر، دستیابی به عکس است. همچنین از آن به عنوان مرحله پیش­پردازش نیز نام برده می‌شود. این مرحله شامل دریافت عکس از منبعی نرم‌افزاری است.

• بهبود تصویر

بهبود تصویر در واقع فرایند بیرون کشیدن و برجسته کردن برخی ویژگی­های مورد نظر از یک تصویر مبهم است. این فرایند می‌تواند شامل تغییر در روشنایی، کنتراست و دیگر ویژگی‌های تصویر باشد.

• ترمیم تصویر

به فرایند بهبود ظاهر یک تصویر، ترمیم تصویر می‌گویند. درحالی که فرایند ترمیم تصویر، برخلاف فرایند بهبود تصویر،  از مدل‌های مشخص ریاضی و احتمالات استفاده می‌کند.

• پردازش رنگ تصویر

پردازش رنگ تصویر، تکنیک‌های مدلسازی رنگ در بستر دیجیتال را شامل می‌شود. این مرحله به واسطه استفاده قابل توجه تصاویر دیجیتال در فضای اینترنت، برتری قابل توجهی پیدا کرده است.

• موجک ها و رزلوشن‌های چندگانه

موجک‌ها برای بیان درجات مختلف رزلوشن در تصاویر استفاده می‌شوند. تصاویر به موجک‌ها یا نواحی کوچکتری برای فشرده‌سازی اطلاعات و همچنین برای بازنمایی هرمی تقسیم‌بندی می‌شوند.

• فشرده‌سازی

فرایندی که فضای لازم برای ذخیره تصویر یا پهنای باند لازم برای انتقال آن را کاهش دهد؛ فشرده‌سازی نام دارد. این امر به ویژه هنگامی صورت می­پذیرد که تصویر برای آپلود در فضای اینترنت استفاده می­شود.

• پردازش ریخت‌شناسانه یا مورفولوژیکی

پردازش ریخت‌شناسانه، مجموعه‌ای از عملیات پردازش تصویر است که تصاویر را براساس شکل‌شان، قدم به قدم دگرگون می‌کند.

• تقسیم‌بندی

تقسیم‌بندی یکی از دشوارترین مراحل پردازش تصویر است. این فرایند شامل تقسیم­بندی یک تصویر به اجزای تشکیل دهنده آن می‌شود.

• نمایش و تشریح

پس از آنکه تصویر در مرحله تقسیم‌بندی به بخش­های مشخصی تقسیم شد، هرکدام از بخش­ها به شکلی که برای پردازش کامپیوتر در مراحل بعدی مناسب باشد، تشریح و ارائه می‌شود. تشریح با استخراج اطلاعات کمّی که به تمایز میان دسته‌های اشیاء کمک می‌کند؛ سروکار دارد.

• تشخیص

این مرحله به هر شیء با توجه به توصیف آن، برچسبی اختصاص می‌دهد.

کاربردهای پردازش تصویر #

از جمله کاربرد­های پردازش تصویر می­ توان به هوش مصنوعی، بینایی ماشین و درنهایت به صنایع متاثر از این فناوری ها مانند: ترمیم تصاویر پزشکی، تکنولوژی های سنجش ترافیک، بازسازی تصویر و تشخیص چهره اشاره کرد.

• ترمیم تصویر پزشکی

پردازش تصویر، به طور ویژه­ای در تحقیقات پزشکی مورد استفاده قرار می­گیرد و باعث دسترسی به راهکارهای مفیدتر و دقیق‌تر درمانی شده است.

 به طور مثال، الگوریتم‌های پیشرفته پردازش تصویر، در تشخیص غدد کوچک سرطانی و در نهایت در تشخیص زودهنگام سرطان سینه کمک می­کند.

از آنجا که در استفاده­های پزشکی لازم است از پردازش‌های تصویر پیشرفته استفاده شود؛ داده­های تصاویر پزشکی نیازمند ارزیابی و سنجش دقیق و تخصصی هستند.

• فناوری‌ سنجش ترافیک

در سیستم دوربین­های ترافیک، از سیستم پردازش تصویرِ ویدیو یا VIPS استفاده می­شود. این سیستم شامل موارد زیر است:

  • سیستمی برای ضبط تصویر
  • سیستم ارتباط از راه دور
  • سیستم پردازش تصویر

در هنگام ضبط ویدیو، سیستم پردازش تصویر، از بخش­های مختلفی تشکیل شده است که با ورود هر وسیله نقلیه به تصویر، سیگنالِ “روشن” را به خروجی سیستم می‌دهد و با خروج وسیله نقلیه از تصویر، سیگنال “خاموش” را به خروجی ارسال می­کند.

بخش­های تشخیص‌دهنده می‌تواند با چندین لنز تنظیم شود و برای ارزیابی ترافیک در مکان مشخصی مورد استفاده قرار گیرد.

از طرف دیگر، این سیستم می‌تواند به طور خودکار شماره پلاک اتومبیل‌ها را ضبط کند، بین انواع وسایل نقلیه تمایز قائل شود، سرعت خودرو ها را بررسی کند و همچنین دارای استفاده‌های متعدد دیگری باشد.

• بازسازی تصویر

پردازش تصویر می‌تواند در بازیابی و ترمیم قسمت­های از دست رفته تصاویر مفید باشد. برای این منظور، نیاز به سیستم‌های پردازش تصویری است که با پایگاه‌های اطلاعات تصاویر موجود آموزش دیده باشند تا بتوانند نسخه‌های جدیدتری از تصاویر قدیمی و آسیب‌دیده را بسازند.

• تشخیص چهره

یکی از مرسوم‌ترین کاربردهای پردازش تصویر که امروزه استفاده می‌شود؛ تشخیص چهره است. این فرایند الگوریتم‌های یادگیری عمیق را دنبال می‌کند که در آغاز، کامپیوتر با ویژگی‌های چهره انسان مثل شکل صورت، فاصله بین دو چشم و … آشنا می‌شود.

 پس از آموختن ویژگی‌های چهره انسان توسط ماشین، شروع به شناخت تصاویر مشابه صورت انسان می‌کند. تشخیص چهره ابزاری ضروری در حوزه امنیت، بیومتریک و حتی فیلترهای بکار رفته در اغلب شبکه‌های اجتماعی است.

مزایای پردازش تصویر #

در اینجا برخی از مزایای پردازش تصویر، فارغ از حوزه کاری آورده شده است:

  • تهیه تصاویر دیجیتال در طیف وسیعی از فرمت­ها(تصویر بهبود یافته، اشعه ایکس، عکس نگاتیو و …)
  • کمک به تفسیر تصاویر توسط انسان
  • استخراج و پردازش اطلاعات از تصاویر برای تفسیر توسط کامپیوتر
  • تغییر و دستکاری پیکسل‌های تصاویر برای دستیابی به تراکم و کنتراست دلخواه
  • امکان ذخیره و بازیابی ساده‌تر تصاویر
  • امکان انتقال ساده‌تر تصاویر

نتیجه گیری #

رشد تکنولوژی‌های یادگیری عمیق منجر به شتاب سریع بینایی کامپیوتر در پروژه‌های متن‌باز(Open Source) شده است که این نکته باعث افزایش نیاز به ابزارهای پردازش تصویر شده است.

 هر ساله تقاضای متخصصین به یادگیری عمیق با سرعت زیادی رو به افزایش بوده و نشان دهنده نیاز حوزه­های مختلف به این فناوری است.

منابع #

لینک کوتاه این مقاله:
امیرمحمد توحیدی
امیرمحمد توحیدی

دیدگاه (3)

  1. بهزاد
    15 آبان 1400

    اموزش نرم افزار هاي كد نويسي هم خواهيد داشت؟

  2. فاطمه بشیری
    18 آبان 1400

    سلام و تشکر از مطلب مفیدتون فقط اینکه مطلب رو طوری شروع کردید که گویا پردازش تصویر و یادگیری عمیق دو موضوع لاینفک هستند، در صورتی که اینگونه نیست این دو کاملا جدا بوده ولی در مسایل زیادی همپوشانی و همکاری دارند. یعنی یادگیری عمیق ، روشی از یادگیری ماشین برروی داده های ماشینی است که در بسیاری از مسایل این داده ها تصویر هستند.
    از طرفی پردازش تصویر به طور کلی اعمال پردازش(هرگونه پردازش) که منجر به استخراج اطلاعات از تصویر و یا تغیر تصویر باشه گفته میشه. در این صورت اون پردازش میتونه یادگیری نباشه اصلا و فقط استخراج ماکزیمم و مینیمم یک تصویر باشه یا مثلا اصلاح تصویر باشه و اصلا برچسبی برای اشیا تصویر وجود نداشته باشه و به برچسب زنی محدود نمیشه .
    این نظر من بود امیدوارم که به بهبود شما کمک کنه

    • امیرمحمد توحیدی
      22 آبان 1400

      ممنون از فیدبکتون

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *