سیما فایل دانلود نمونه سوال , دانلود پروژه
پروژه نرم افزاری تشخيص حروف و يا تعيين حالات عاطفی

عالی

docx 1395 مرداد 17 حجم : 1 مگابایت صفحات : 864500 تومان خرید و دانلود

پروژه نرم افزاری تشخيص حروف و يا تعيين حالات عاطفی

در اين نرم افزار عكس ورودي از منبع گرافيكي خوانده مي شود و پس از انجام عملياتي مثل resize كردن، تبديل به حالت grayscale در برخي موارد، الگوريتم هاي لبه يابي، گذراندن از فيلترهاي خاص، scan كردن، انجام عمليات dilation و erosion، يافتن رنج RGB نقاط مختلف تصوير، پيدا كردن ضرايب همبستگي و تشابهات و ... مي توان كادر صورت، كادر لب و دهان، كادر چشم، كادر ابروها، فواصل و ابعاد مورد نظر را به دست آورد و با مقايسة اين اطلاعات با ديتاي موجود حالات و حروف را تشخيص داد. اين نرم افزار مي تواند در پروژه هاي روباتيك يا براي درك حروف براي ناشنوايان مورد استفاده قرار گيرد.

پروژه نرم افزاری تشخيص حروف و يا تعيين حالات عاطفی


فهرست مطالب

عنوان

مقدمه

فصل 1: پردازش تصوير رقمي

-نمايش تصوير رقمي

-مراحل اساسي پردازش تصوير

-پردازش

-نمونه برداري و چندي كردن

نمونه برداري و چندي كردن يكنواخت

نمونه برداري و چندي كردن غيريكنواخت

-چند رابطه پايه اي بين پيكسلها

همسايه هاي يك پيكسل

اتصال

-همبستگي

-فيلتر كردن

فيلترهاي آرام كننده

فيلتر كردن مكان پايين گذر

فيلتر كردن پايين گذر

-پردازش تصوير زندگي

مباني رنگ

مدلهاي رنگ

مدل RGB

-بخش بندي تصوير

-آشكارسازي لبه

توصيف پايه اي

 

پيوند لبه و آشكارسازي مرز

 

-شكل شناسي

 

گسترش و سايش

 

- چند تعريف پايه اي

 

- گسترش

 

سايش

 

فصل 2: نمودارهاي بلوكي، مراحل و نحوة انجام پروژه

 

-فلوچارت برنامة لب خواني از روي چهره

 

-فلوچارت برنامة تشخيص حالات از روي چهره

 

-مقدمه اي بر پردازش تصوير

 

عوامل دروني

 

عوامل خارجي

 

-گرفتن عكس

 

-خواندن عكس

 

-يافتن كادر صورت

 

Resize كردن عكس

 

تبديل عكس رنگي به حالت gray scale

 

الگوريتم لبه يابي

 

Scan كردن عكس

 

-فيلتركردن تصوير

 

-دستور strel

 

-انجام dilation و erosion

 

-پيدا كردن كادر لب

 

-يافتن اندازه هاي مورد نظر لب

 

-مقايسة اندازه ها با اندازه هاي حالات لب

 

-ادامة عمليات براي تشخيص حالت

 

-يافتن كادر حدودي چشم توسط correlation

 

- چند تعريف پايه اي

 

- گسترش

 

- سايش

 

فصل 2: نمودارهاي بلوكي، مراحل و نحوة انجام پروژه

 

-فلوچارت برنامة لب خواني از روي چهره

 

-فلوچارت برنامة تشخيص حالات از روي چهره

 

-مقدمه اي بر پردازش تصوير

 

- عوامل دروني

 

- عوامل خارجي

 

-گرفتن عكس

 

-خواندن عكس

 

-يافتن كادر صورت

 

- Resize كردن كادر صورت

 

- تبديل عكس رنگي به حالت grayscale

 

- الگوريتم لبه يابي

 

- Scan كردن عكس

 

-فيلتر كردن تصوير

 

-دستور strel

 

-انجام dilation و erosion

 

-پيدا كردن كادر لب

 

-يافتن اندازه هاي مورد نظر لب

 

-مقايسة اندازه ها با اندازه هاي حالات لب

 

-ادامة عمليات براي تشخيص حالت

 

-يافتن كادر حدودي چشم توسط correlation

 

-دستور Corr2

 

-مقايسه با اندازه هاي چشم در حالات مختلف

 

-يافتن كادر ابرو

 

-يافتن فاصلة دو ابرو

 

-توضيحاتي در مورد بيومتريك چهرة انسان

 

مقدمه

 

روشهاي بيومتريك

 

استخراج ويژگيهاي صورت در بيومتريك

 

فصل سوم: نتايج و نكات به دست آمده از انجام پروژه

 

-تغييرات ابعاد لب، چشم و ابرو

 

-ابعاد لب براي افراد مختلف

 

-نرماليزه كردن ابعاد

 

-ابعاد قطر چشم در حالات مختلف

 

-رنج RGB به دست آمده از رنگ لب

 

-رنج RGB به دست آمده از رنگ پوست

 

-چند مورد پيشنهادي در راستاي ادامة پروژه

 

4-فهرست كلمات لاتين

 

5-مراجع و منابع

 

 

فلوچارت برنامة لب خواني از روي چهره
فلوچارت برنامة تشخيص حالات از روي چهره

مقدمه يا بر پردازش تصوير صورت:

صورت يك منبع قوي از اطلاعات رفتاري انسانهايت. بيان چهره نشان دهندة حالات رفتارهاي اجتماعي رگوله شده سيگنالهاي مربوط به صحبت كردن، حالات عاطفي و ... است كه مي تواند عملكرد مغز و آسيب شناسي را آشكار سازد.

اغلب سيستمهاي توصيف كنندة صوت از مدلهاي پيچيدة دو يا سه بعدي صوت را براي درك حالات مثل پيشاني، ابرو، چشمها، بيني، دهان، گونه و چانه استفاده مي كنند.

اغلب شش حالت براي درك حالات چهره وجود دارد كه عبارتند از خوشحالي، ترس، عصبانيت، تنفر، ناراحتي و تعجب.

اگر به بررسي صورت به صورت ديناميك بپردازيم تغييرات صوت مي تواند به دو دليل باشد:

1-عوامل دروني و 2-عوامل بيروني

  • عوامل دروني

كارهاي ممكن براي بررسي

منبع

كلاس بندي، شناسايي كامل

استنباط از عواطف و نيتهاي دروني

لب – خواني

تصميم گيري مرد يا زن بودن

تخمين سن

هويت

حالت چهره اي

صحبت

جنسيت

سن

 

  • عوامل خارجي

تأثيرات

منبع

سايه روشن، رنگ، ساية خود فرد، Highlight

اثرات مناظر، تجزيه، كانون، نويز تصوير، نمونه‌برداري از توزيع تابش، روشن شدن غيرمستقيم، سايه انداختن

مشاهدة هندسة صوت

روشنايي

پردازش تصوير

موارد ديگر

 

حالات عضلاني صورت نقش مهمي در رفتار بشر مثل سخنراني، توصيف چهره و ... اشارات دارند. پنفيلد به اين نكته دست يافته است كه مدارات عصبي كه وابسته به دست ها و صورت (بخصوص دهان) هستند نقش مهم در فعل و انفعالات ماشين دارند.

كلاً مراحل درك تصوير 6 مرحله است:

1-گرفتن عكس 2-پردازش اوليه 3-توصيف ويژگيها 4-مرحله دريافت 5-بيس اطلاعات 6-تشخيص

*گرفتن عكس: در اين پروژه براي هر حالت يا در مورد اداي هر حرف از 5 الي 9 نفر توسط دوربين ديجيتال عكسبرداري شده كه اين عكسها با كيفيت بالا در ابعاد 1536×2048 هستند.

براي بالا بردن دقت لازم است كه حروف به طور كامل توسط افراد ادا شوند و هم چنين لازم است حالات به خوبي اجرا شوند، پس ممكن است از هر فرد براي هر حالت يا هر خرف عكسهاي متعدد گرفته شود. عكسها با زمينة تيره درنظر گرفته شده اند.

اين عكسها اطلاعات آماري از ابعاد و هندسة صورت را در همة اين حالات نتيجه مي دهد.

خواندن عكس:

خواندن عكس توسط دستور Imread صورت مي گيرد.

\filename)آدرسA=(Imread(

اين دستور تصوير را از فايلهاي گرافيكي مي خواند و به صورت ديتا قابل استفاده مي سازد.

هر پيكسل عكس حاوي اطلاعات لازم است.

يافتن كادر صورت:

براي resize كردن يك عكس يك function به نام myresize تعريف نموده ايم. در اين function اين گونه عمل مي كنيم:

ابتدا size عكس را به حدود  كاهش داده اين چون تصاوير بسيار بزرگ بوده و سرعت انجام برنامه كم است پس از اين دستور استفاده مي كنيم:

(ضريب كوچك كردن عكس و A=Imresize(filename

2-تبديل عكس رنگي به حالت grayscale:

براي اين كار از دستور زير استفاده مي كنيم.

I=rgb 2 gray (filename)

با انجام اين كار اطلاعات از رنج 256 رنگ به رنج 5 تا 1 تبديل مي شوند. بدين ترتيب انجام بسياري از عمليات روي تصوير مقدور مي گردد.

3-الگوريتم لبه يابي:

براي پيدا كردن كادر صورت نياز به پيدا كردن لبه هاي چهره داريم و يك الگ.ريتم نياز است تا با توجه به تغييرات رنگ كادر نسبت به چهره ما تيرگي ها و روشني ها و سايه ها و ... لبه هاي موجود در عكس را پيدا كنيم تا بتوانيم با scan كردن لبه هاي مختلف كادر چهره را پيدا كنيم. الگوريتم مورد نظر به اين صورت است.

عكس را به حالت باينري درمي آورد: A=Im2bw(IC, gray+hresh (IC))

دستور strel بعداً به طور كامل توضيح داده مي شود:

 se = strel (disk,6)

A = Imclose (A , se)

B = Imopen (B , se)

4-Scan كردن عكس:

براي اين كار لازم است اطلاعات موجود روي عكس از چهار طرف scan شوند تا به خطوط كادر صورت برسيم.

ما با عكسهايي با Bacjground سياه يا تيو كار كرده ايم.

پس براي يافتن كادر چهره نكتة مهم لبه يابي است.

چهار لبة اطراف صورت اين گونه تعريف شده اند.

*Upedge

يك function با عنوان updage براي پيدا كردن لبة بالايي صورت درنظر گرفته ايم. در اين function از گوشة بالا سمت چپ شروع به scan كردن نموده و با رسيدن به لبه هاي مورد نظر مقادير ثبت مي گردد.

Downedge:

يك function براي يافتن لبة پائين صورت است مانند upedge مي باشد با اين تفاوت كه از گوشة پائين سمت چپ شروع به scan به صورت افقي مي كنيم.

Right edge:

در اين function، scan كردن از گوشة بالا سمت راست شروع مي شود و عمليات جاروب كردن به صورت عمودي صورت مي گيرد.

Left edge:

نقطة شروع آن مانند upedge مي باشد ولي scan كردن به صورت عمودي انجام مي گيرد حال با مقادير به دست آمده از اين چهار function كادر صورت به دست مي آيد.

فيلتر كردن تصوير:

براي حذف نويز تصوير نياز به يك فيلتر پائين گذر داريم تا كمي محوي در تصوير ايجاد كند. چون ما براي پيدا كردن ناحية لب و مقادير آن از رنج RGB رنگ لب استفاده كرده ايم، ممكن است وجود هرگونه لكه روي پوست صورت مشكل ساز باشد، به همين دليل از يك فيلتر پائين گذر استفاده مي كنيم تا گونه اي يكنواختي روي صورت ايجاد سازد.

ما بدين صورت از فيلتر پائين گذر استفاده كرده ايم:

I=imfilter (i,h);

كه با اين كار عكس i را از فيلتر h عبور مي دهيم. H يك فيلتر پائين گذر است كه آن را خودمان در ابتداي برنامه تعريف مي كنيم. ابعاد I با ابعاد i (تصوير قبل از فيلتر شدن) يكسان است.0

دستور strel:

اين دستور يك المنت ساختاري مورفولوژيك بوجود مي آورد.

SE= strel (shape , parameters)

Shape: شل مورد نظر

Parameters: ابعاد شكل مورد نظر

به اين صورت كه ما با دادن يك شكل، كادر مورد نظر خود را تعريف مي كنيم و ابعاد آن را تعيين مي نماييم. با حركت دادن آن كادر روي تصوير اصلي عمليات مورد نظر روي آن كادر انجام مي گيرد. اين گونه كه ما بعضي از نقاط را در واقع 1 كرده و برخي ديگر را 0 مي كنيم. پس عملياتت فقط روي نقاط 1 صورت مي گيرد.

مثلاً ما براي انجام dilation و erosion روي صورت به اين صورت از اين دستور استفاده كرده ايم:

SE=strel (“rectangle” , [15 20])

با اين كار روي يك مستطيل اين عمليات را انجام مي دهيم و يا حركت آن روي همة عكس در تمام تصوير روي نقاط مورد نظر گسترش و سايش را انجام مي دهيم. يا مثلاً در مورد پيدا كردن كادر چشم و يا ابرو يك كادر تعريف كرده و با حركت آن كادر روي تمام صورت و پيدا كردن همبستگي بيشتر چشم و ابرو را مي يابيم.

* انجام dilation و erosion (گسترش سايش):

در هنگام كار با عكسهاي رنگي مثلاً براي پيدا كردن لب اگر بخواهم با دادن مقادير RGB لب، آن را محل يابي كنيم ممكن است وجود لكه روي پوست يا وجود قرمزي هاي كوچك روي نواحي صورت مشكل ساز شود.

پس لازم است ابتدا اين لكه هاي كوچك را حذف كنيم.

بهترين روش براي اين كار درنظرگرفتن مشاع همسايگي است. به اين صورت كه نكته هايي كه اندازة كوچكي دارند باز هم كوچكتر و كوچكتر شده و محو شوند. به اين عمل erosin مي گويند. در نرم افزار matlab از دستور Imerode براي اين منظور استفاده مي شود.

A=Imerode (IM , SE)

IM همان اسم عكس مورد نظر مي باشد.

SE نيز قبلاً تعريف شده است كه در دستور strel شرح داده شد. پس از انجام  شرح داده شد. پس از انجام خسهد (سايش) با اين مشكل ممكن است مواجه شويم كه برخي از اطلاعات لازم نيز از بين برود. به همين دليل لازم است كه پس از محو كردن نقاط و لكه هاي غيرلازم، اطلاعات لازم را تقويت كنيم يعني نقاطي كه شعاع همسايگي خوبي دارند و ممكن است با erosion دچار محوي شده باشند، دوباره تقويت كنيم به همين دليل عمليات dilation را انجام مي دهيم.

براي انجام اين كار در نرم افزار matlab از دستور Imedilate استفاده مي كنيم.

اين دستور به اين صورت استفاده مي شود.

A=Imedilate (IM , SE)

IM در واقع همان عكس مورد نظر اسيت و SE در دستور Strel به طور كامل شرح داده شد.

با تغيير مقادير SE ضريب گسترش و سايش را تغيير مي دهيم يعني با كم كردن يا زياد كردن SE مقدار شعاع همسايگي لازم يا بزرگي و كوچكي يك لكه را براي محو شدن يا باقي ماندن و هم چنين تقويت آن تعيين مي كنيم. در dilation و erosion اوليه اين مقدار را بزرگ تعيين مي كنيم تا لكه هاي صورت به طور كامل حذف شود و پس از پيدا كردن حدود كادر لب براي اينكه لب را به طور كامل داشته باشيم و نويزهاي اطراف آن را حذف كرده و اطلاعات مفيد لب را تقويت كنيم بار ديگر erosion و dilation انجام مي هيم ولي با مقدار SE كمتر.

*پيدا كردن كادر لب:

پس از فيلتر كردن و انجام dilation و erosion بسياري از نويزهاي مزاحم موجود در تصوير حذف شده و مي توانيم از اطلاعات موجود در عكس رنگي براي مكان يابي استفاده كنيم.

عكس رنگي از سه لايه رنگي تشكيل شده كه مجموع اين سه لايه عكس را با رنگ واقع نشام مي دهد و هر طيف رنگي روي عكس حاوي اطلاعات R، G و B مي باشد. پس لازم است كه سه لايه عكس را جداسازي كرده و رنج رنگهاي مورد نظر را بدست آوريم.

ابتدا رنج RGB رنگ لب را در عكسهاي متفاوت به دست مي آوريم و با ميانگين گيري كيا تعيين حدود بالا و پايين رنگ لب را در حالات متفاوت به دست مي آوريم.

يعني نقاطي كه مشخصة رنگي آنها در حدود مورد نظر تعيين شده در رنج لب قرار مي گيرند جدا مي كنيم، سپس اين نقاط را با 1 مقدار دهي مي كنيم و بقيه نقاط موجود در عكس را 0 مي كنيم. پس از آن با همان function كه بريا پيدا كردن كادر صورت تعريف كرده ايم (myresize)، كادر لب را پيدا مي كنيم. در بعضي از حالات پس از اين كار در اطراف لب نويز مشاهده مي شود، پس بار ديگر عمليات dilation و erosion را با قدرت كمتري نسبت به قبل انجام مي دهيم و دوباره با همان function كادر لب را پديا مي كنيم تا به طور واضح ابعاد لب را داشته باشيم. و سپس همان كادر به دست آمده را روي عكس اصلي به دست مي آوريم و

* يافتن اندازه هاي مورد نظر لب:

حال كه كادر لب را بدست آورده اتيم ابعاد مورد نظر را روي كادر به دست آمده درمي آوريم تا بتوانيم با حالات به دست آمده در اداي حروف متفاوت يا حالات عاطفي مقايسه كنيم.

لازم است كه اندازه هاي به دست آمده نسبت به ابعاد عكس نرماليزه شود. زيرا ممكن است ابعاد متفاوت باشد. عكسهاي گرفته شده در ابعاد 1536×2048 مي باشند. پس ما ابتدا ابعاد لب را نسبت به ابعاد عكس به دست مي آوريم. نكتة مهم اين است كه نمي توان ابعاد را بر ابعاد لب در حالت نرمال تقسيم كرد، زيرا براي تشخيص  اينكه مردي چه فرمي را ادا مي كند يا چه حالتي دارد لزومي ندارد كه ما به عكس حالت نرمال او دسترسي داشته باشيم و برنامه اين قابليت را داردت كه در محدودة وسيعي براي افراد متفاوت نشخيص داشته باشد. البته نرماليزه كردن نسبت به حالت نرمال لب مي تواند دقت كار را كمي افزايش دعد ولي در عوض ما، در تشخيص تعداد افراد دچار محدود مي شويم.

*مقايسه اندازه ها با اندازه هاي حالات لب در هنگام اداي حروف يا حالات مختلف:

ما ابتدا ابعاد لب را در حالات مختلف ادا، حروف يا حالات مختلف احساسي اندازه گيري كرده ايم. براي اين كار اين اندازه ها را در افراد متفاوت به دست مي آوريم و  سپس نسبت به ابعاد  عكس نرماليزه كرده ايم. با اين كار محدودة اندازه ها در مورد هر حرف يا هر حالت تعيين يم شود. حال ابعاد لب فردي كه عكس او به عنوان ديتاي جديد وارد شده با اين محدوده ها مقايسه مي شود و مشخص مي شود كه اين ابعاد به كدام حرف نزديك تر است. پس حرف مورد نظر مشخص مي شود و نام حرف بالاي عكس نشان داده مي شود.

*ادامه عمليات كه براي تشخيص حالت از روي چهره لازم مي باشند:

در مورد اداي حروف فقط مكان يابي لبها لازم مي باشد و تغييرات در اجزاي ديگر صورت محسوس نمي باشد ولي در مورد حالات عاطفي كه روي چهره نمايان مي شود علاوه بر تغييرات روي لب، روي عناصر ديگر نيز علاماتي مشاهده مي شود. پس لازم است مثلاً اندازه هاي چشم يا ابروها را داشته باشيم.

*يافتن كادر حدودي چشم با اندازه گيري ميزان همبستگي با چشم نمونه:

پس از مقايسه حالت لب نمونة ورودي با نمونه هيا ديگر و تشخيص حالات لب مثل خنده، تعجب، ناراحتي، عصبانيت و ... تغييرات ديگر چهره را تعيين مي كنيم.

براي يافتن كادر چشم اين گونه عمل مي كنيم:

1-ابتدا يك كادر چشم به صورت نمونه به برنامه مي دهيم و توسط دستور Imeread كه قبلاً توضيح داده شد، اين عكس خوانده مي شود و اطلاعات آن ثبت مي گردد.

2-حال عكس جديد به عنوان ورودي خوانده مي شود.

3-عكس ورودي مثل حالات قبل توسط function كه تعيرف شده است يعني myresize در ابعاد مورد نظر كوچك شده و به حالت grayscale درمي آيد. و كادر صورت درمي آيد.

5-توسط دستور strel كادري با مقادير مورد نظر تعريف مي كنيم تا با حركت كادر روي عكس مورد نظر ورودي عمليات رو يتمام عكس صورت گيرد.

6-اين كادر روي تصوير حركت مي كند و ضريب همبستگي (كه در ادامه توضيح داده خواهد شد.) تصوير چشم نمونه كه در ابتدا اطلاعات آن ثبت شده بود، با كادر مورد نظر روي عكس محاسبه مي گردد. هر جا كه اين همبستگي ماكزيمم باشد كادر مورد نظر روي عكس بيشترين تشابه با تصوير چشم نمونه را دارد و در واقع يك كادر حدودي از چشم را به ما مي دهد و پس از آن مي توان كادر اصلي چشم را به دست آورد.

دستور corr2 (پيدا كردن ميزان همبستگي):

اين دستور همبستگي دوبعدي كافي بين دو ماتريس را محاسبه مي كند.

R=Corr2(A , B)

A و B دو ماتريس هم سايز هستند.

پروژه نرم افزاری تشخيص حروف و يا تعيين حالات عاطفی
دریافت شماره تلفن همراه صرفا جهت پشتیبانی می باشد و برای تبلیغات استفاده نمیشود.
تمامی حقوق وب سایت برای سیمافایل محفوظ می باشد . ©
خرید هاست