- تصویر چیست؟
- تاریخچه پردازش تصویر چیست؟
- پردازش تصویر چیست؟
- چرا ما به پردازش تصویر دیجیتال نیازمند هستیم؟
- مراحل پردازش تصویر
- مرحله پیش پردازش تصویر یا بهبود داده های تصویری
- تکنیک ها و ابزارپردازش تصویر
- روش های فشرده سازی در پردازش تصویر
- مرحله پیش پردازش تصویر یا بهبود داده های تصویری
- کاربردهای پردازش تصویر
- پردازش تصویر در تصمیم گیری
- مزایای پردازش تصویر
- مزایای پردازش تصویر در کسب و کار
- چگونه می توان از داده های پردازش تصویر برای حل مشکلات کسب و کار استفاده کرد؟
- آینده پردازش تصویر
- چــالش های پردازش تصویر
- نتیجه گیری
- منابع
یادگیری عمیق طی چند سال گذشته تأثیر عمیقی بر شاخههای مختلف تکنولوژی داشته است. یکی از داغ ترین موضوعات در این صنعت، بینایی کامپیوتر است. رشته پردازش تصویر به طور دائم درحال گسترش و رشد است. درطول پنج سال گذشته، افزایش قابل توجهی به پردازش تصاویر و امکانات آن مانند: مورفولوژی تصویر، شبکههای عصبی، پردازش تصویر رنگی، متراکمسازی دادههای تصویر، تشخیص تصویر و سیستمهای انالیز تصویر به وجود آمده است.
به زبان ساده، می توان گفت توانایی مستقل کامپیوترها در درک تصاویر و ویدیوها نتیجه بینایی کامپیوتر است. اتومبیلهای خودران، روشهای امنیتی بیومتریک(Biometrics) و تشخیص چهره، همگی به قابلیت های بینایی کامپیوتر وابسته هستند. درواقع، هسته بینایی ماشین را پردازش تصویر تشکیل داده است.
تصویر چیست؟ #
تصویر از هر شکل دادهای دیگری برای درک توسط انسان ها بهتر است. بینایی به بشر این اجازه را می دهد که جهان اطراف را درک کند. درک تصویر، انالیز تصویر و بینایی کامپیوتر قصد دارد اثر بینایی انسان را بوسیله درک کامپیوتر و فهم تصویر، تکرار و تقلید کند .
پیش از آنکه به پردازش تصویر بپردازیم، ابتدا باید مبانی یک تصویر را بشناسیم. یک تصویر با ابعادش (ارتفاع و عرض) براساس تعداد پیکسلهایش مشخص میشود. به طور مثال، اگر ابعاد عکسی 500×400 (ارتفاع×عرض) باشد، مجموع تمام پیکسلهای این عکس 200 هزار پیکسل خواهد بود.
یک پیکسل، نقطهای در عکس است که سایه، کدری یا رنگ مشخصی دارد. معمولاً به یکی از شیوههای زیر وجود دارد:
- طیف خاکستری: این مشخصه در یک پیکسل دارای عددی صحیح است بین صفر تا 255 (که صفر بیانگر کاملاً مشکی و 255 بیانگر کاملاً سفید است).
- قرمز سبز آبی(RGB): هر پیکسل از سه عدد صحیح بین صفر تا 255 تشکیل شده است. (که هرکدام از اعداد صحیح بیانگر شدت رنگ قرمز، سبز و آبی هستند)
- RGBA: نسخهای توسعه یافته از RGB است که زمینه آلفا نیز به آن افزوده شده که بیانگر کدری تصویر است.
پردازش تصاویر دیجیتال نیازمند عملیاتی است که مراحل آن مشخص و ثابت باشد و بر روی هر پیکسل از عکس اعمال شود. در مرحله اول پردازش تصویر، این عملیات بصورت پیکسل به پیکسل اعمال میشود.
زمانی که این مرحله به طور کامل انجام شد، وارد مرحله دوم شده و مقادیر خروجی این عملیاتها برای هر پیکسل از عکس قابل اندازهگیری خواهد بود.
تاریخچه پردازش تصویر چیست؟ #
اولین کاربرد تصویر دیجیتال به زمانی برمیگردد که یک تصویر برای نخستین بار توسط کابل زیر دریایی میان لندن نیویورک ارسال شد.این اتفاق نوین در در اوایل دهه 1920 در صنعت روزنامه رخ داد. و سبب شد که زمان مورد نیاز برای انتقال تصویر در سراسر اتلانتیک از یک هفته به سه ساعت در روز کاهش پیدا کند.
برای انتقال کابل ها، بوسلیله تجهیزات چاپ تخصصی تصاویر را رمز گزاری کرده و سپس آنها را باسازی میکردند
بعضی مشکلات اولیه نیز در خصوص کیفیت بصری تصاویر دیجیتال رخ میداد که مربوط میشد به، تولیدکنندگان چاپی. تصاویر دیجیتال نیاز به ذخیره سازی و قدرت محاسباتی دارند، طوریکه پیشرفت در زمینه پردازش تصویر دیجیتال بستگی دارد به توسعه فناوری هایی همچون؛ رایانهای های دیجیتال، و پشتیبانی دستگاهایی برای ذخیره سازی، نمایش و انتقال داده ها.
دومین کاربرد پردازش تصویر در تاریخ به دهه 1960 برمیگردد، در آن زمان تحقیقاتی صورت گرفت در زمینه تصویربرداری ماهواره ای، تبدیل استاندارد رادیو عکس، تصویر برداری پزشکی، ویدیوفون، شناسایی حروف و تقویت عکس با استفاده از تکنیکهای پردازش تصویر دیجیتال یا پردازش تصویر. هزینه این تحقیقات گزاف بود و به همین دلیل در دهه 1970 دسترسی به رایانههای ارزانتر و تغییر و تحول در سختافزارهای مخصوص، پردازش تصویر دیجیتال گسترش پیدا کرد.
در آن موقع پردازش همزمان تصاویر برای مسأله های خاصی چون تبدیل استانداردهای تلویزیون ممکن بود.
رایانه های چند منظوره با سریعتر شدن جای سخت افزارها را گرفتند و در سال 1994 در تالار مشاهیر فناوری فضایی، از فناوری پردازش تصویر برای کاربردهای پزشکی رونمایی شد. و با فراهم شدن رایانهها و پردازندههای سیگنالی در سال 2000 پردازش تصویر دیجیتال به متداولترین شکل پردازش تصویر تبدیل شد.
پردازش تصویر چیست؟ #
برای خیلی از افراد، پردازش تصاویر دیجیتالی می تواند موضوعی اضطراب آور و مشکل به نظر برسد. اما درواقع فقط چنداصل وجود دارند که شما برای استفاده از برنامههای گرافیکی باید آن ها را بدانید. فناوری دیجیتال مدرن امکان دستکاری کردن سیگنالهای چند بعدی را در سیستمهایی که از مدارهای دیجیتال ساده تا رایانههای موازی پیشرفته را شامل میشود را ممکن کرده است. بنابراین ما بر روی مفاهیم اساسی پردازش تصویر تمرکز خواهیم کرد. اما پردازش تصویر چیست؟
به فرآیند تبدیل یک عکس به فرم دیجیتال و اعمال عملیاتهایی مشخص در جهت استخراج اطلاعات از آن، “پردازش تصویر”(Image Processing) میگویند. معمولاً فرایند پردازش تصویر با همه عکسها به عنوان سیگنالهایی دوبعدی رفتار میکند و متودهای از پیش تعیینشده پردازش سیگنال را بر روی آنها اعمال میکند.
پنج نوع اصلی پردازش تصویر عبارتند از:
- تجسم: یافتن اشیائی که در تصویر قابل دیدن نیستند.
- تشخیص: تمایز قائل شدن و شناسایی اشیاء در تصویر.
- واضح ساختن و ترمیم کردن: ساختن عکسی بهبود یافته از عکس اصلی.
- شناسایی الگو: سنجیدن الگوهای مختلف در اطراف اشیاء درون عکس.
- بازیابی: جستجو کردن عکسها از پایگاه اطلاعاتی گسترده عکسهای دیجیتال که به عکس اصلی شبیه باشند.
چرا ما به پردازش تصویر دیجیتال نیازمند هستیم؟ #
بگذارید با یک مثال اهمیت پردازش تصویر را توضیح دهیم. همانطور که میدانیم ماهواره ابزار مفیدتری برای کسب اطلاعات در مورد جهان و همچنین سیاره زمین است. بسیاری از تصمیماتی که گرفته می شود؛ تصمیماتی هستند که مستقیماً با پیشفرضها گرفته نمیشوند؛ آن ها توسط ما و بااستفاده از تصاویر ماهوارهای گرفته شدهاند. اما تصاویرماهوارهای به فرم RGB هستند؛ از این رو باید این تصاویر را به ترکیب رنگی مناسب و همچنین فرمت مناسب پردازش تصویر انجام تبدیل کنیم. ماهوارهها این تصاویر یا هرگونه دادهای دیجیتالی که توسط کامپیوتر پردازش می شوند را ارسال می کنند. حالا تصمیم داریم؛ عناصر اولیهی پردازش تصویر و عملیاتی که بر روی تصاویر انجام می شود؛ را شرح دهیم.
مراحل پردازش تصویر #
مراحل Image Processing چیست؟ پردازش تصویر دیجیتال، طیف وسیعی از سختافزار، نرم افزار و مبانی نظری را دربرمی گیرد. روش های پردازش تصویر از دو حوزه کاربردی اصلی سرچشمه می گیرند:
- بهبود دادهای تصویری برای تفسیر انسانی
- پردازش دادههای تصویری برای درک ماشین
در یک عملیات کامل Image Processing از مرحله اولیه که تصویر به یک سیستم نرم افزاری وارد می شود تا آخرین مرحله آن که به هر شئ مشخص در تصویر یک برچسب اختصاص داده می شود؛ شامل چندین مرحله می شود. مراحل پردازش تصویر دیجیتال در ادامه توضیح داده شده است.
مرحله پیش پردازش تصویر یا بهبود داده های تصویری #
• دستیابی به تصویر
اولین مرحله از فرایند پردازش تصویر، دستیابی به عکس است. همچنین از آن به عنوان مرحله پیش پردازش نیز نام برده میشود. این مرحله شامل دریافت عکس از منبعی نرمافزاری است.
برای انجام این کار به یک سنسور تصویربرداری و قابلیت دیجیتالی کردن سیگنال تولید شده توسط سنسور نیاز است. سنسور می تواند یک تلوزیون تکرنگ، رنگی و یا یک دوربین اسکنر خطی باشد. اگر خروجی دوربین تصویربرداری، یک تصویر دیجیال نباشد؛ یک مبدل آنالوگ به دیجیتال آن را دیجیتالی می کند.
•اصلاح بهبود تصویر
بهبود تصویر در واقع فرایند بیرون کشیدن و برجسته کردن برخی ویژگی های مورد نظر از یک تصویر مبهم است. اصلاح و بهبود ، عملکردیاست که به طریقی بتواند شانس موفقیت سایر فرایندهای پردازش تصویر را افزایش دهد. اصلاح و بهبود تصویر با تکنیک هایی برای افزایش کنتراست، حذف نویز و جداسازی مناطقی که ساختار آن ها احتمالاً اطلاعات عددی را نشان می دهد؛ سر و کار دارد.
• ترمیم تصویر
به فرایند بهبود ظاهر یک تصویر، ترمیم تصویر میگویند. درحالی که فرایند ترمیم تصویر، برخلاف فرایند بهبود تصویر، از مدلهای مشخص ریاضی و احتمالات استفاده میکند.
• پردازش رنگ تصویر
پردازش رنگ تصویر، تکنیکهای مدلسازی رنگ در بستر دیجیتال را شامل میشود. این مرحله به واسطه استفاده قابل توجه تصاویر دیجیتال در فضای اینترنت، برتری قابل توجهی پیدا کرده است.
• موجک ها و رزلوشنهای چندگانه
موجکها برای بیان درجات مختلف رزولوشن در تصاویر استفاده میشوند. تصاویر به موجکها یا نواحی کوچک تری برای فشردهسازی اطلاعات و همچنین برای بازنمایی هرمی تقسیمبندی میشوند.
تکنیک ها و ابزارپردازش تصویر #
تصاویری که توسط حسگر های معمولی گرفته میشوند با یکسری نویز و عدم فوکوس دوربین همراه اند. و به همین دلیل نیاز به پردازش اولیه دارند، برای پردازش تصویر دیجیتال دو روش شناسایی وجود دارد.
• فیلترینگ تصویر
از این روش برای تغییر اصلاح و بهبود تصویر ورودی استفاده میشود. که با کمک فیلترهای مختلف موجود میتوان بعضی از ویژگیهای موجود در تصویر را حذف کرد و یا هم بر روی آن تمرکز کرد. و همچنان با کمک فیلترینگ میتوان میزان نویز و موارد مدخل را نیز کاهش داد.
• یافتن لبه
از این روش برای استخراج دادهها و بخشبندی تصاویر به منظور یافتن لبه اشیا (object edges) در تصاویر پردازش شده استفاده میگردد.
• فشردهسازی
فرایندی که فضای لازم برای ذخیره تصویر یا پهنای باند لازم برای انتقال آن را کاهش دهد؛ فشردهسازی نام دارد. این امر به ویژه هنگامی صورت می پذیرد که تصویر برای آپلود در فضای اینترنت استفاده می شود.
• دلیل واهمیت فشرده سازی
به صورت کلی ديجيتال شدن سيگنال های صوت و تصوير باعث می شود پهنای باند مورد نياز جهت انتقال برنامه ها بیشتر از نوع آنالوگ باشد . بنابرين بايد راه حلی برای این مشکل پيدا کرد ، چراکه بدون انجام اين امر، اين فناوری ( ديجيتال سازی سيگنالها ) بدون استفاده خواهد ماند .
راه حل اين مشکل استفاده از روشهای رمز گذاری است که با کاهش میزان اطلاعات ارسالی موجب حفظ کیفیت سیگنال نیز میشود. روش های زیادی برای برای انجام این کار وجود دارد. اما در ابتدا باید با توجه به معایب و مزایا روشهای موجود و خصوصیات هرکدام انتخاب درست را کرد.
در مورد سيگنال های صدا وتصوير مورد استفاده در صنعت گسترده ای همچون راديو و تلويزيون اين مطالعات از مدتها قبل در دنيا آغاز شده و باید گفت تحقيقات در دنيا به نتيجه قطعی در مورد کليات اين روش رسيده است و و به تبع آن مصرف روی آورده اند. اکثریت تولید کنندگان تجهیزات به این تکنولوژی تبع آن مصرف روی آورده اند.
روش های فشرده سازی در پردازش تصویر #
• روش JPEG
ساده ترین روش در فشرده سازی تصاویر JPEG است. از این روش در فشرده سازی عکس های گرافیکی استفاده می شود؛ به طوریکه سعی می شود عکس های متحرک به حالت فشرده و فریم به فریم تبدیل شوند.
• روش MPEG
در این روش اطلاعات تصویر حدود ۵.۱ مگابیت برثانیه انتقال داده میشود و برای تصاویر ویدیوئی استفاده می شود. در این روش امکان ذخیره حدود 650 مگابایت اطلاعات معادل 70 دقیقه تصویر متحرک وجود دارد و اطلاعات به صورت یک سریال و بیت های هماهنگ کننده ارسال می شوند که مکان و جاگذاری بیت های اطلاعاتی جهت ثبت اطلاعات صدا و تصویر تعیین میکند.
• روش MPEG 2
دراین نوع روش از ضریب فشرده سازی بالاتری نسبت به روش های قبلی استفاد می شود و دسترسی به اطلاعات 3 تا 15 مگابیت بر ثانیه است. و از آن در دی وی دی استفاده می شود. در این روش همچنین هر فریم شامل اطلاعات دیجیتالی است که با روش های پیشرفته جایگزین می شوند.
• روش MPEG 4
این روش نیز یکی از تکنیک های پرکاربرد در پردازش تصویر بوده است و در تجهیزاتی استفاده می شود که با انتقال کند و سریع اطلاعات فعالیت میکند. در این روش قابلیت ارائه تصویر با کیفیت وجود دارد. همچنین جبران خطا در مورد رایانه، تلفن همراه و شبکه نیز اهمیت بالایی دارد.
یک نمونه از کاربردهای این روش در فیلم و صحنه های بازی تنیس است. به صورتیکه صحنه را به دو مؤلفه بازیکن و زمین بازی تقسیم میکند که در آن زمین بازی دائما ثابت می باشد و در تمام تصاویر تکرار می شود. اما بازیکن همواره در حال حرکت می باشد. در این روش پهنای باند اشغالی بسیار کاهش می یابد و با روش های پیشرفته حجم فایل ها کاهش می یابد. این روش به تازگی توسط گوگل ابتدا شده که می تواند حجم تصاویر را تا حد زیادی یعنی 35 درصد کاهش دهد.
• پردازش ریختشناسانه یا مورفولوژیکی
پردازش ریختشناسانه، مجموعهای از عملیات پردازش تصویر است که تصاویر را براساس شکلشان، قدم به قدم دگرگون میکند.
مرحله پیش پردازش تصویر یا بهبود داده های تصویری #
• تقسیمبندی
تقسیمبندی یکی از دشوارترین مراحل پردازش تصویر است. این فرایند شامل تقسیم بندی یک تصویر به اجزای تشکیل دهنده آن میشود.
یک روش تقسیمبندی مستحکم روند را بسوی راهحل موفقیتآمیز یک مشکل تصویربرداری سوق میدهد. الگوریتمهای تقسیمبندی ضعیف یا نامنظم تقریباً همیشه به شکست منجر می شوند. نقش کلیدی تقسیمبندی، استخراج شخصیتها و کلمات فردی از پسزمینه است.
• نمایش و تشریح
پس از آنکه تصویر در مرحله تقسیمبندی به بخش های مشخصی تقسیم شد؛ هرکدام از بخش ها به شکلی که برای پردازش کامپیوتر در مراحل بعدی مناسب باشد، تشریح و ارائه میشود. باید روشی برای توصیف داده ها مشخص شود تا ویژگی های مدنظر نمایان شوند. تشریح با استخراج اطلاعات کمّی که به تمایز میان دستههای اشیاء کمک میکند؛ سروکار دارد.
• تشخیص
در این مرحله باید روشی برای توصیف داده ها مشخص شود تا ویژگی های مدنظر نمایان شوند. سپس به هر شیء با توجه به توصیف آن، برچسبی اختصاص میدهد.
کاربردهای پردازش تصویر #
از جمله کاربردهای پردازش تصویر می توان به فناوری هوش مصنوعی، بینایی ماشین و درنهایت به صنایع متأثر از این فناوری ها مانند: ترمیم تصاویر پزشکی، تکنولوژی های سنجش ترافیک، بازسازی تصویر و تشخیص چهره اشاره کرد.
برای مطالعه بیشتر درباره کاربردهای پردازش تصویر کلیک کنید.
• ترمیم تصویر پزشکی
پردازش تصویر دیجیتال، به طور ویژه ای در تحقیقات پزشکی مورد استفاده قرار می گیرد و باعث دسترسی به راهکارهای مفیدتر و دقیقتر درمانی شده است.
به طور مثال، الگوریتمهای پیشرفته پردازش تصویر پزشکی، در تشخیص غدد کوچک سرطانی و در نهایت در تشخیص زودهنگام سرطان سینه کمک می کند.
• پردازش تصویر صنعتی
پیشرفتهای تکنولوژی پردازش تصویر صنعتی منجر به رونق و کیفیت تولید در بیشتر کاربردهای صنعتی آن شده است. به طور مثال، پایش برخی شرایط محیطی در صنایع هوافضا یا ساخت و تولید میتواند سخت یا خطرناک باشد. بینایی ماشین میتواند جایگزین مناسبی برای بازرسی انسانی باشد.
از آنجا که در استفاده های پزشکی لازم است از پردازشهای تصویر پیشرفته استفاده شود؛ داده های تصاویر پزشکی نیازمند ارزیابی و سنجش دقیق و تخصصی هستند.
• فناوری سنجش ترافیک
در سیستم دوربین های ترافیک، از سیستم پردازش تصویر ویدیو یا VIPS استفاده می شود. این سیستم شامل موارد زیر است:
- سیستمی برای ضبط تصویر
- سیستم ارتباط از راه دور
- سیستم پردازش تصویر
در هنگام ضبط ویدیو، سیستم Image Priocessing، از بخش های مختلفی تشکیل شده است که با ورود هر وسیله نقلیه به تصویر، سیگنال “روشن” را به خروجی سیستم میدهد و با خروج وسیله نقلیه از تصویر، سیگنال “خاموش” را به خروجی ارسال می کند.
بخش های تشخیصدهنده میتواند با چندین لنز تنظیم شود و برای ارزیابی ترافیک در مکان مشخصی مورد استفاده قرار گیرد.
از طرف دیگر، این سیستم میتواند به طور خودکار شماره پلاک اتومبیلها را ضبط کند، بین انواع وسایل نقلیه تمایز قائل شود، سرعت خودرو ها را بررسی کند و همچنین دارای استفادههای متعدد دیگری باشد.
• بازسازی تصویر
پردازش تصویر دیجیتال میتواند در بازیابی و ترمیم قسمت های از دست رفته تصاویر مفید باشد. برای این منظور، نیاز به سیستمهای پردازش تصویری است که با پایگاههای اطلاعات تصاویر موجود آموزش دیده باشند تا بتوانند نسخههای جدیدتری از تصاویر قدیمی و آسیبدیده را بسازند.
• تشخیص چهره
یکی از مرسومترین کاربردهای پردازش تصویر که امروزه استفاده میشود؛ تشخیص چهره است. این فرایند الگوریتمهای یادگیری عمیق را دنبال میکند که در آغاز، کامپیوتر با ویژگیهای چهره انسان مثل شکل صورت، فاصله بین دو چشم و … آشنا میشود.
پس از آموختن ویژگیهای چهره انسان توسط ماشین، شروع به شناخت تصاویر مشابه صورت انسان میکند. تشخیص چهره ابزاری ضروری در حوزه امنیت، بیومتریک و حتی فیلترهای بکار رفته در اغلب شبکههای اجتماعی است.
پردازش تصویر در تصمیم گیری #
مدل سازی پیش بینی راه کارهایی دارد که معمولا با استفاده از داده ها و رخدادهای گذشته به بررسی و تخمین رویدادهای آینده می پردازند. به طور مثال پیش بینی گرایش پیش فرض یک مشتری نیازمند در اختیار داشتن پردازش جمعی از داده ها میباشد.
برای این نوع از تجزیه و تحلیل، داده های مورد استفاده ابتدا از مسیرهای جمع آوری داده های اطاعاتی مانند فرم ها و پایگا های داده گرفته شده و سپس به صورت دسته ای وارد می شوند. در این فرآیند فرض بر این است که مهلت کافی وجود دارد و زمان مساله حیاتی نیست.
همچنین فرض می شود که اطلاعات مربوط به فرد یا نهادی که مورد ارزیابی قرار می گیرد از روش های معمولی مانند فرم های بانکی که توسط خود شخص ارائه می شود نیز در دسترس باشد.
مزایای پردازش تصویر #
در اینجا برخی از مزایای پردازش تصویر، فارغ از حوزه کاری آورده شده است:
- تهیه تصاویر دیجیتال در طیف وسیعی از فرمت ها(تصویر بهبود یافته، اشعه ایکس، عکس نگاتیو و …)
- کمک به تفسیر تصاویر توسط انسان
- استخراج و پردازش اطلاعات از تصاویر برای تفسیر توسط کامپیوتر
- تغییر و دستکاری پیکسلهای تصاویر برای دستیابی به تراکم و کنتراست دلخواه
- امکان ذخیره و بازیابی سادهتر تصاویر
- امکان انتقال سادهتر تصاویر
مزایای پردازش تصویر در کسب و کار #
اکثر تیم های تجزیه و تحلیل به شکل مؤثر و مطلوب در سازمان ها قرار ندارند و سبب شده تا الگوریتم های اشتباه و بدون نتایح ملموس پدید آیند و در نتیجه اهداف یک کسب و کار را محقق نکنند و همه این ها باعث هدر رفتن فرصت ها و هزینه ها میشود.
افزایش داده های موجود همراه با با داده های تصویری می تواند در این موقعیت بسیار مفید باشد؛ به گونه ای که می توان شرایط وابسته به زمان داده را که در دسترس نیست با استفاده از پردازش تصویر تغییر داد و این خلع را پر کرد.
برای مثال در بانکداری می توان از پردازش تصویر در برنامه های وام مسکن، کارت های اعتباری تقلبی و دستگاه های خودپرداز استفاده کرد. همچنان پردازش تصویر در بخش های امنیتی نیز کاربردی است؛ مانند: تطبیق دادن تصاویر و تشخیص ویژگی های مشترک و یا تطابق دادن با داده های گذشته، از روش های موجود است.
چگونه می توان از داده های پردازش تصویر برای حل مشکلات کسب و کار استفاده کرد؟ #
یادگیری ماشین(Machine learning) یا بطور کلی پردازش تصویر شاهد ارتقا چشمگیری در سال های اخیر بوده است. Hackathons هکاتون رویدادی است که در آن برنامهنویسان رایانه و افراد دیگری که درگیر توسعه نرمافزار هستند؛ از جمله طراحان گرافیکی، طراحان رابط کاربری و مدیران پروژه گرد هم میآیند و در توسعه پروژههای نرمافزاری و گاهی سختافزاری با یکدیگر همکاری میکنند. هکاتونها معمولاً بین یک روز تا یک هفته به طول میانجامند.
برخی از هکاتونها تنها برای اهداف اجتماعی و آموزشی هستند؛ هر چند که در اکثر موارد هدف هکاتونها ایجاد نرمافزارهای مفید و قابل استفاده است و به عنوان یک روش مفید برای سرعت بخشیدن به توسعه مرزهای دانش در این حوزه شناخته می شود.
در نهایت باید توجه داشته باشیم که پردازش تصویر شکل تکامل یافته پردازش متن است و همان گونه که پردازش متن در زندگی ما تغییرات زیادی را به وجود آورده باید منتظر تغییرات ایجاد شده توسط پردازش تصویر نیز باشینم.
آینده پردازش تصویر #
پردازش تصویر شروعی بر پایان جستجوی متنی
امروزه جستجوی متنی به یکی از نیازهای مردم در سرتاسر جهان تبدیل شده است. جستجوی متنی به ما امکان دسترسی به انبوهی از اطلاعات را در مورد هر پرسش احتمالی و ضروری خواهد داد. اما اگر توانایی ایجاد متن مورد نظر خود را نداشته باشید؛ جستجوی متنی سخت و زمانبر میشود.
بسیاری از مسافران و گردشگران خود را در چنین وضعیت هایی دیده اند. دراین موقعیت آنچه کمک کننده است؛ تصویر بوده؛ تمام اطلاعاتی که ما در دسترس داریم. پردازش تصویر، پردازش ویدئو و پردازش صوت است که سبب موقعیت سنجی و پیش بینی در مورد پرسش مورد نظر ما می شود.
به گفته، مدیر ارشد پروژه های مرتبط با موتور جستجوگر گوگل: ” گوگل همیشه یک راه حل برای آسودگی شما دارد. هرکجای دنیا که هستید با تلفن همراه خود از موضوع مورد نظر خود یک عکس بگیرید و برای جستجوگر گوگل ارسال کنید. همانند جستجوی ساده ی یک متن ، گوگل شما را راهنمایی خواهد کرد.
طبق تحقیقاتی که در دانشگاه کارولینای جنوبی انجام شده است، پردازش تصویرکمک های شایانی به نابینایان نیز کرده است و مسیریابی ساده را ممکن ساخته است و به نابینایان این امکان را داده است که به سادگی مسیریابی کنند؛ به این شکل که فرد نابینا یک جلیقه و یک عینک به چشم می گذارد. حس گرهای ۳ بعدی و سنسورهای روی جلیقه که مانند لرزشگر(ویبره) تلفن همراه است این امکان را به فرد نابینا می دهد که مسیریابی را انجام دهد و هر کجای شهر که بخواهد؛ مسیریابی کند.
این فناوری کاربرد های گوناگون دارد به طور مثال: راننده خودکار گوگل با بررسی تصاویر دوربین های ترافیکی و درک ۳ بعدی از موقعیت خودرو نسبت به اجسام دیگر و سایر خودرو ها، شما را به مقصد می رساند.
همچنین از پردازش تصویر برای تشخیص چهره مجرمین استفاده می کنند تا جایی که با شناسایی آن ها از وقوع جرم جدید پیشگیری می کنند. و از پردازش تصویر در بیمارستان ها نیز با تشخیص دقیق و دقت بالاتر در تجهیزات به یاری پزشکان می آید.
پردازش تصویر، عرصه جدیدی از رابطه میان انسان و کامپیوتر ایجاد کرده است. خدمات انسانی و وسایل نقلیه اتوماتیک مانند خودروی گوگل آینده جهان را در دست خواهند گرفت. همچنین در حوزه صنعت هوایی نیز هواپیماهای بدون سرنشین می توانند به مرور جایگزین هواپیماهای فعلی شوند.
در حوزه پزشکی نیز فناوری پردازش تصویر ابعاد گستره ای از پزشکی هوشمند را ارائه می دهد. به گونه ای که در آینده ربات هایی ایجاد می شوند که امکان جراحی های از راه دور و بسیار حساس را به پزشکان می دهند و همچنین روانشناسان با استفاده از پردازش تصویر و تطبیق با الگوریتم های روانشناسی، می توانند حالات درونی یک فرد را حدس بزنند تا جایی که در پیش بینی رفتار بیماران کاربرد دارد.
ذات انسان ها به گونه است که اطلاعات تصویری را سریع تر از داده های متنی بررسی می کند؛ یک داده تصویری می تواند شامل حجم زیادی داده متنی باشد؛ بزودی موتورهای جستجو مبتنی بر پردازش تصویر جای موتورهای جستجوگر فعلی که بر مبنای پردازش متن هستند را خواهند گرفت.
از دیگر ابعاد پیشرفت در پردازش تصویر می توان به نسل جدید دوربین های تلفن همراه اشاره کرد. تلاش های زیادی برای رسیدن به سطح پردازش تصویر بینایی انسان انجام شده است تا بتوان به درک چشم انسان برسد و چشم ما را به نادیده ها نیز باز کنند. این فناوری ها که با تکیه بر سه رنگ اصلی در تصویر برداری و با استفاده از سنسورهای مشخص عمل میکند. در کشاورزی بسیار کاربردی می باشد و می تواند محصولات سالم را از ناسالم برای ما متمایز کند.
هنوز دید روشنی از پردازش تصویر در صنایع در دست نیست، ولی گوگل ادعا می کند که تا ۳ سال آینده ۳۰ درصد پردازش های متنی جای خود را به پردازش تصویر خواهند داد.
چــالش های پردازش تصویر #
برخلاف بسیاری از فناوری های نوین، که در تجارت نیز سهولت ایجاد می کنند. تجاری سازی پردازش تصویر، یک چالش است؛ برای پردازش تصویر با دقت بالا، احتیاج به میلیاردها سنسور است که این موضوع یکی از موانع اصلی پیش روی این علم است.
با توجه به اینکه همواره حجم داده ها در دنیا سریع تر از میزان ذخیره سازی آنها رشد می کند، بزرگترین چالش پردازش تصویر این است که با مشکل فضا برای ذخیره سازی مواجه خواهد شد. در صورتیکه برای این مشکل هم راه حلی ارائه شده است! به این شکل که به جای ذخیره سازی تمام داده های خام تولید شده توسط دوربین ها، فقط میزانی که مورد نیاز است را ذخیره می کند.
آشکار ساز پیکسلی در این قسمت به کمک آمده و توانسته تا 25 درصد حجم داده را صرفه جویی کند. چالش اساسی پردازش تصویر این است که آیا می تواند مانند چشم انسان عمل کند یا خیر؟ بینایی انسان معقوله بسیار پیچیده ای است؛ تا جایی که ما هنوز به طور کامل نتوانسته ایم بینایی خود را درک کنیم تا این که به توسعه پردازش تصویر بپردازیم.
نتیجه گیری #
رشد تکنولوژیهای یادگیری عمیق منجر به شتاب سریع بینایی کامپیوتر در پروژههای متنباز(Open Source) شده است که این نکته باعث افزایش نیاز به ابزارهای پردازش تصویر شده است.
هر ساله تقاضای متخصصین به یادگیری عمیق با سرعت زیادی رو به افزایش بوده و نشان دهنده نیاز حوزه های مختلف به این فناوری است.
منابع #
برای آشنایی بیش تر با پردازش تصویر و کلیات و مفاهیم آن به این وبسایت ها مراجعه کنید. در زیر لینک مربوط به یک وبسایت مرتبط با آثار آینده هوش مصنوعی در زندگی بشر ایجاد شده است.
دیدگاه (3)
بهزاد
15 آبان 1400اموزش نرم افزار هاي كد نويسي هم خواهيد داشت؟
فاطمه بشیری
18 آبان 1400سلام و تشکر از مطلب مفیدتون فقط اینکه مطلب رو طوری شروع کردید که گویا پردازش تصویر و یادگیری عمیق دو موضوع لاینفک هستند، در صورتی که اینگونه نیست این دو کاملا جدا بوده ولی در مسایل زیادی همپوشانی و همکاری دارند. یعنی یادگیری عمیق ، روشی از یادگیری ماشین برروی داده های ماشینی است که در بسیاری از مسایل این داده ها تصویر هستند.
از طرفی پردازش تصویر به طور کلی اعمال پردازش(هرگونه پردازش) که منجر به استخراج اطلاعات از تصویر و یا تغیر تصویر باشه گفته میشه. در این صورت اون پردازش میتونه یادگیری نباشه اصلا و فقط استخراج ماکزیمم و مینیمم یک تصویر باشه یا مثلا اصلاح تصویر باشه و اصلا برچسبی برای اشیا تصویر وجود نداشته باشه و به برچسب زنی محدود نمیشه .
این نظر من بود امیدوارم که به بهبود شما کمک کنه
امیرمحمد توحیدی
22 آبان 1400ممنون از فیدبکتون