کد مقاله را وارد کنید !
تشخیص نوشتار با تشخیص حرکات دست با استفاده از واکسل‌سازی: برآورد دقیق موقعیت سه¬بعدی و تشخیص حرکات دست نوشتاری با استفاده از شبکۀ پیش‌بینی واکسل-به-واکسل V2V-PoseNet
دوره 1، شماره 4، 1402، صفحات 45 - 52
نویسندگان : سیدمجتبی میرزاده 1 ، محمد زارع* 2

1 کارشناس ارشد رشتۀ مهندسی کامپیوتر، دانشگاه آزاد واحد تهران غرب، تهران، ایران

2 گروه فناوری اطلاعات، دانشگاه صنعتی شیراز، شیراز، ایران

چکیده :
بیشتر روش‌های موجود برای تخمین ژست دست سه‌بعدی از یک نقشۀ عمقی تک از یک چارچوب مشترک استفاده می‌کنند که با گرفتن یک نقشۀ عمق دوبعدی، مختصات سه‌بعدی نقاط کلیدی را مستقیماً از طریق شبکه‌های عصبی کانولوشنی دوبعدی پیش‌بینی می‌کنند. اولین ضعف این رویکرد وجود انحنای پرسپکتیو در نقشۀ عمق دوبعدی است. در حالی که نقشۀ عمق به‌طورذاتی داده‌های سه‌بعدی است، روش‌های قبلی بسیاری از نقشه‌های عمق را به‌عنوان تصاویر دوبعدی در نظر می‌گیرند که می‌تواند شکل واقعی شیء را از طریق پراجکشن از فضای سه¬بعدی به دوبعدی تحریف کند. این مجبور به انجام تخمین مقاوم در برابر انحنای چشم‌انداز می‌شود. دومین ضعف رویکرد سنتی این است که رگرسیون مستقیم مختصات سه‌بعدی از تصویر دوبعدی، یک نقشه‌برداری بسیار غیرخطی است که موجب دشواری در روند یادگیری می‌شود. برای غلبه بر این ضعف‌ها، ابتدا مسئلۀ تخمین ژست دست انسان سه‌بعدی از یک نقشۀ عمقی تک را به یک پیش‌بینی وکسل¬به¬وکسل تبدیل می‌کنیم که از یک شبکۀ وکسلی سه¬بعدی استفاده می‌کند و برای هر نقطۀ کلیدی احتمال وکسل مربوطه را تخمین می‌زند. ما مدل خود را به‌عنوان یک شبکۀ عصبی کانولوشنی سه¬بعدی طراحی می‌کنیم که تخمین‌های دقیقی را در حال اجرا به صورت زمان واقعی ارائه می‌دهد.
کلمات کلیدی :
V2V-PoseNet، شبکۀ وکسل¬به¬وکسل، Voxel-to-Voxel Prediction Network، شبکۀ پیش‌بینی وکسل¬به¬وکسل، تخمین ژست سه‌بعدی دست، تخمین ژست انسان، نقشۀ عمق واحد
بازدید امروز
64
بازدید دیروز
171
بازدید کل
44,975
پشتیبانی آنلاین از طریق واتساپ

پژوهشگران گرامی؛ پاسخگوی سوالات شما عزیزان از طریق واتساپ هستیم !


جهت ارسال پیام در واتساپ اینجا کلیک نمائید !