اخذ مجوز از وزارت فرهنگ و ارشاد اسلامی به شماره ثبت 91917 مورخ 1401/04/20
فصلنامه "پژوهش های نوین در شهرهوشمند " در سیویلیکا نمایه میشود.
فصلنامه " پژوهش های نوین در شهرهوشمند" در magiran نمایه میشود.
فصلنامه "پژوهش های نوین در شهرهوشمند" در SID نمایه میشود.
دسترسی آزاد به مقالات فصلنامه "پژوهش های نوین در شهرهوشمند "
COPE
سامانه مشابهت یاب علمی ( سمیم نور)
سامانه مشابهت یاب علمی ( ایرانداک)
تشخیص نوشتار با تشخیص حرکات دست با استفاده از واکسلسازی: برآورد دقیق موقعیت سه¬بعدی و تشخیص حرکات دست نوشتاری با استفاده از شبکۀ پیشبینی واکسل-به-واکسل V2V-PoseNet
دوره 1، شماره 4، 1402، صفحات 45 - 52
1 کارشناس ارشد رشتۀ مهندسی کامپیوتر، دانشگاه آزاد واحد تهران غرب، تهران، ایران
2 گروه فناوری اطلاعات، دانشگاه صنعتی شیراز، شیراز، ایران
چکیده :
بیشتر روشهای موجود برای تخمین ژست دست سهبعدی از یک نقشۀ عمقی تک از یک چارچوب مشترک استفاده میکنند که با گرفتن یک نقشۀ عمق دوبعدی، مختصات سهبعدی نقاط کلیدی را مستقیماً از طریق شبکههای عصبی کانولوشنی دوبعدی پیشبینی میکنند. اولین ضعف این رویکرد وجود انحنای پرسپکتیو در نقشۀ عمق دوبعدی است. در حالی که نقشۀ عمق بهطورذاتی دادههای سهبعدی است، روشهای قبلی بسیاری از نقشههای عمق را بهعنوان تصاویر دوبعدی در نظر میگیرند که میتواند شکل واقعی شیء را از طریق پراجکشن از فضای سه¬بعدی به دوبعدی تحریف کند. این مجبور به انجام تخمین مقاوم در برابر انحنای چشمانداز میشود. دومین ضعف رویکرد سنتی این است که رگرسیون مستقیم مختصات سهبعدی از تصویر دوبعدی، یک نقشهبرداری بسیار غیرخطی است که موجب دشواری در روند یادگیری میشود. برای غلبه بر این ضعفها، ابتدا مسئلۀ تخمین ژست دست انسان سهبعدی از یک نقشۀ عمقی تک را به یک پیشبینی وکسل¬به¬وکسل تبدیل میکنیم که از یک شبکۀ وکسلی سه¬بعدی استفاده میکند و برای هر نقطۀ کلیدی احتمال وکسل مربوطه را تخمین میزند. ما مدل خود را بهعنوان یک شبکۀ عصبی کانولوشنی سه¬بعدی طراحی میکنیم که تخمینهای دقیقی را در حال اجرا به صورت زمان واقعی ارائه میدهد.
بیشتر روشهای موجود برای تخمین ژست دست سهبعدی از یک نقشۀ عمقی تک از یک چارچوب مشترک استفاده میکنند که با گرفتن یک نقشۀ عمق دوبعدی، مختصات سهبعدی نقاط کلیدی را مستقیماً از طریق شبکههای عصبی کانولوشنی دوبعدی پیشبینی میکنند. اولین ضعف این رویکرد وجود انحنای پرسپکتیو در نقشۀ عمق دوبعدی است. در حالی که نقشۀ عمق بهطورذاتی دادههای سهبعدی است، روشهای قبلی بسیاری از نقشههای عمق را بهعنوان تصاویر دوبعدی در نظر میگیرند که میتواند شکل واقعی شیء را از طریق پراجکشن از فضای سه¬بعدی به دوبعدی تحریف کند. این مجبور به انجام تخمین مقاوم در برابر انحنای چشمانداز میشود. دومین ضعف رویکرد سنتی این است که رگرسیون مستقیم مختصات سهبعدی از تصویر دوبعدی، یک نقشهبرداری بسیار غیرخطی است که موجب دشواری در روند یادگیری میشود. برای غلبه بر این ضعفها، ابتدا مسئلۀ تخمین ژست دست انسان سهبعدی از یک نقشۀ عمقی تک را به یک پیشبینی وکسل¬به¬وکسل تبدیل میکنیم که از یک شبکۀ وکسلی سه¬بعدی استفاده میکند و برای هر نقطۀ کلیدی احتمال وکسل مربوطه را تخمین میزند. ما مدل خود را بهعنوان یک شبکۀ عصبی کانولوشنی سه¬بعدی طراحی میکنیم که تخمینهای دقیقی را در حال اجرا به صورت زمان واقعی ارائه میدهد.
کلمات کلیدی :
V2V-PoseNet، شبکۀ وکسل¬به¬وکسل، Voxel-to-Voxel Prediction Network، شبکۀ پیشبینی وکسل¬به¬وکسل، تخمین ژست سهبعدی دست، تخمین ژست انسان، نقشۀ عمق واحد
V2V-PoseNet، شبکۀ وکسل¬به¬وکسل، Voxel-to-Voxel Prediction Network، شبکۀ پیشبینی وکسل¬به¬وکسل، تخمین ژست سهبعدی دست، تخمین ژست انسان، نقشۀ عمق واحد
-
170
-
48
-
1401/11/09
-
1402/01/31
-
1402/05/24