مایکروسافت چگونه دوربین سرفیس هوشمند خود را ساخت؟

مایکروسافت چگونه دوربین های سرفیس را می سازد؟

ساختار دوربین هوشمند سرفیس های مایکروسافت چگونه است؟

«از روز اول تولید دستگاه‌های سرفیس هاب ۲ (Surface Hub 2) ما می‌دانستیم که دوربین‌های خود را هوشمند خواهیم کرد.» این‌ها سخنان  «استیون بتیش» مسئول نظارت بر اختراعات و نوآوری‌های شرکت مایکروسافت است. دوربین هوشمند سرفیس هاب ۲، یک سورپرایز 799.99 دلاری از سوی کمپانی بزرگ مایکروسافت است که هفته گذشته از آن رونمایی شد. این دوربین، چارچوب بندی خودکار تصاویر را بدون خطای پرسپکتیو و مواردی که معمولا در سایر دوربین‌های اتاق کنفرانس مشاهده می‌کنید، ارائه می‌دهد. برای پاسخ به سئوالات شما که مایکروسافت چگونه دوربین سرفیس هوشمند خود را ساخت؟ در ادامه با آرتل همراه شوید.

 

دوربین های هوشمند مایکروسافت چگونه ساخته می شوند:

این دستگاه می‌تواند چهره‌ها و بدن‌های حاضر در اتاق کنفرانس را تا شعاع ۸ متری خود شناسایی کند تا مطمئن شود همه افراد در یک اتاق در طول جلسات قابل مشاهده هستند. دوربین هوشمند سرفیس هاب ۲ به لطف میدان دید 136 درجه‌ای خود، تقریبا می‌تواند کل اتاق کنفرانس را به‌خوبی پوشش دهد؛ آن هم در حالی که هم افراد نزدیک و هم افراد دورتر، دارای وضوح (Focus) تصویری مناسب باشند.

مایکروسافت در نظر داشت تا دوربین سرفیس هاب ۲ خود را قبل از شیوع بیماری همه گیر کرونا به بازار عرضه کند تا بتواند به پیشبرد جلسات هیبریدی (جلساتی که هم شرکت کننده‌ی حضوری و هم غیرحضوری دارد) کمک به‌سزایی داشته باشد. به همین دلیل است که این وسیله، به‌شکل ماژولار طراحی شده و می‌توان آن را از بالای نمایشگرهای 55 یا 85 اینچی جدا کرد.

«ما می دانستیم که می خواهیم این تجربه را (تجربه‌ی جلسات هیبریدی) توسعه دهیم. ما دقیقا نمی‌دانستیم چگونه و یا به چه شکل این تغییر را ایجاد خواهیم کرد اما مطمئن بودیم که قرار است شکل برگزاری جلسات تغییر کند و این تغییر می‌بایست با توجه به نیازهای مردم و همسو با سیر تکامل اتاق کنفرانس و فرهنگ حاکم بر نحوه‌ی برگزاری این جلسات باشد.

دستگاه‌های بزرگی مانند سرفیس هاب ۲، با داشتن صفحه نمایش 85 اینچی، چالش‌هایی را برای به تصویر کشیدن همه افراد در یک اتاق جلسه با دوربین سنتی ارائه کردند. بتیش می‌گوید: «ما برای اداره اتاق‌های بزرگ‌تر به دوربینی متفاوت از تکنولوژی رایج نیاز داشتیم»، بنابراین شرکت (مایکروسافت) دست به کار شد.

بتیش و تیم متخصص تحت نظارت او، یک ساز و کار اپتیکال جدید، مدل هوش مصنوعی و کامپیوتر «اج» را برای دست‌یابی به این هدف طراحی و تولید کردند و توانستند توان محاسباتی و عکاسی دوربین ساخته شده را به شکل محسوسی افزایش دهند. بتیش می‌گوید در باره سئوال مایکروسافت چگونه دوربین سرفیس هوشمند خود را ساخت؟ چنین می گوید: «این دستگاه دارای محاسبه‌گر داخلی با ظرفیت محاسباتی 1 ترافلاپس است تا بتواند پاسخ گوی نیازهای محاسباتی هوش مصنوعی به کار رفته در دوربین باشد.»

این توان محاسباتی شامل برنامه اتوفریمینگی که در دوربین قرار دارد، نیز می‌شود. بنابراین چیزی که بیرون می‌آید فقط یک تصویر «4K» است، بدون نیاز به نرم‌افزاری جانبی برای خواندن و یا دریافت تصاویر ضبط شده و ارسال آن به سیستم عامل. این بدان معناست که: این دستگاه به معنای واقعی کلمه مانند یک وب کم برای سرفیس هاب به نظر می‌رسد.

این بدان معناست که تمام کارهای هوش مصنوعی روی خود دوربین انجام می‌شود و برای پردازش به فضای ابری یا حتی از طریق سیم به سرفیس هاب 2 ارسال نمی‌شود. دوربین مدل هوش مصنوعی را اجرا می‌کند، تمام داده‌ها را پردازش می‌کند و بر اساس آن تصمیم می‌گیرد که تصویر را برش دهد. در حالی که کادربندی خودکار می‌تواند همه افراد یک اتاق را به‌طور اتوماتیک ثبت کند، دوربین هوشمند همچنین از جبران شیب برای تنظیم تصویر برای موقعیت دوربین و ایجاد تماس چشمی طبیعی‌تر استفاده می‌کند. همچنین می‌تواند جلوه چشم ماهی‌ (Fish Eye) را از لنزهای زاویه باز حذف کند تا افراد در داخل اتاق‌های جلسه دچار اعوجاج نشوند یا کشیده به نظر نرسند.

 

بتیش توضیح می‌دهد: «ما یک لنز دارای ۱۱ عنصر، کاملا شیشه‌ای و با وضوح فوق‌العاده نزدیک به حد شکست طراحی کردیم. در پشت لنز یک سنسور 12 مگاپیکسلی (4000 در 3000) با دیافراگم ثابت ۱.۸ قرار دارد که همگی در تولید تصویری با کیفیت «4K» نقشی اساسی را ایفا می‌کنند. هرچند زاویه‌ی دید واقعی لنز ۱۸۴ درجه است که این یعنی دوربین میتواند پشت سر خود را هم مشاهده کند، هرچند هنگام خروجی دادن تنها از زاویه‌ای ۱۳۶ درجه‌ای پشتیبانی می‌کند.»

با این حال، تمام این قطعات سخت افزاری بدون هوش مصنوعی که دوربین هوشمند سرفیس را پشتیبانی می‌کنند، چیزی نیستند. مایکروسافت این پروژه را قبل از همه‌گیری آغاز کرد، اما باید مدل‌ هوش مصنوعی خود را در طول همه‌گیری آموزش و ارتقا می‌داد تا چالش‌ پر کردن اتاق‌های جلسه با مردم را به خوبی پشت سر بگذارد.

 

بتیش در مصاحبه‌ی خود توضیح می‌دهد که: «ما به نیوزلند رفتیم زیرا آنها هیچ مورد کرونایی نداشتند و ما نیز دفاتری در آنجا داشتیم. ما بازیگران مرد و بازیگران زن را برای آزمایش فناوری و جمع آوری داده‌ها در انواع اتاق‌ها استخدام کردیم، زیرا برای طراحی هوش مصنوعی مدنظر خود به مجموعه‌ای عظیم از داده‌ها نیاز داشتیم.»

 

مایکروسافت مدل هوش مصنوعی خود را روی صورت و بدن آموزش داد تا مطمئن شود که کاملا فراگیر است و افرادی را که همیشه رو به دوربین نیستند شناسایی می‌کند. حتی از افراد و چهره‌های مصنوعی برای بهبود تنوع خود در موقعیت‌ها و چهره‌های متفاوت استفاده کرد. مسئول نظارت بر اختراعات مایکروسافت می‌افزاید: «ما یک فناوری داخلی بسیار جالب داریم که می‌تواند بر اساس داده‌های دریافتی، اقدام به تولید داده‌های مصنوعی کند، بنابراین توانستیم افراد و چهره‌های مصنوعی تولید کنیم.»

 

دوربین هوشمند برای تشخیص حیوانات خانگی یا حیوانات آموزش ندیده است. بنابراین این بدان معناست که اگر گربه یا سگ اداری وارد دید شود، سعی نمی‌شود به‌طور خودکار یک جلسه را مجدد تنظیم کند. مایکروسافت همچنین اصول حقوق و قانونی هوش مصنوعی خود را در این پروژه اعمال کرده است که شامل مجموعه‌ای از قوانین و شروط است تا این اطمینان را به مخاطبان خود بدهد که  داده‌های شخصی جمع‌آوری شده توسط این هوش مصنوعی به شکلی عادلانه و به دور از نیات سوء، مورد استفاده قرار خواهد گرفت.

«اگر به مجموعه داده‌های ما نگاه کنید، از نظر تفاوت بین گروه‌های مختلف سنی، نژادی، جنسیت، رنگ پوست، مدل‌های مو و غیره، کاملا شگفت‌انگیز است. من فکر می‌کنم یکی از چیزهایی که در دوربین گنجانده شده و ممکن است افراد با دیدن روی جعبه متوجه آن نشوند، استحکام و جامعیتی است که این مدل دوربین دارد. در ادامه این رئیس رده بالای مایکروسافت می‌گوید که: «ما این امکان را داشتیم که یک سال قبل این دوربین را روانه‌ی بازار کنیم؛ اما شرکت در سال گذشته به صورت مداوم مشغول ارزیابی قابلیت‌های خودکار قاب‌بندی دوربین هوشمند خود بود تا مطمئن شود که آن‌قدر تند یا کند نیست و محتوا را از دست نمی‌دهد. هر فریمی که دوربین به دست می‌آورد، تصمیم می‌گیرد که آیا ارزش آن را دارد که تصویر را جابه‌جا کند و دوباره برش دهد یا نه.»

با خواندن این ویژگی‌ها ممکن است مشتاق شده باشید که از این دوربین 799.99 دلاری روی یک رایانه شخصی ویندوزی معمولی استفاده کنید، اما موضوع به این سادگی نیست. در حالی که تمام مدل‌های محاسباتی و هوش مصنوعی در داخل دوربین هوشمند سرفیس هاب ۲ قرار دارد، اما دوربین واقعاً برای استفاده به عنوان یک وب‌کم معمولی طراحی نشده است. بتیش در این مورد توضیح می‌دهد که: «ارتفاع، زوایا و هوش مصنوعی برای چندین نفر دور و نزدیک طراحی شده است. هرچند از منظر فنی می‌توانید از یک پایه برای این دوربین طراحی کنید و آن را به رایانه شخصی متصل کنید، اما فکر نمی‌کنم آن‌گونه که انتظارش را دارید پاسخ‌گوی نیاز خانگی شما باشد»

 

این اولین باری نیست که مایکروسافت روی بهبود وب‌کم‌ها و دوربین‌های خود تمرکز می‌کند. سرفیس پرو ایکس (Surface Pro X) در حال حاضر دارای ویژگی تماس چشمی مبتنی بر هوش مصنوعی است که به نظر می‌رسد شما همیشه در حال برقراری تماس چشمی هستید بدون توجه به آنچه در طول یک تماس ویدیویی به دنبال آن هستید. اپل نیز یک ویژگی مشابه با نام «FaceTime Attention Correction » را به iOS 13 اضافه کرد. بتیش می‌گوید: «الگوریتم‌هایی که در تماس چشمی [برای Surface Pro X] استفاده می‌کنیم، همان الگوریتم‌هایی هستند که برای تشخیص چهره‌ها در داخل این دوربین استفاده می‌کنیم.»

 

مایکروسافت به وضوح این دوربین هوشمند را برای سرفیس هاب ۲ طراحی کرده، اما با شایعات مداوم در مورد وب‌کم‌های با نام تجاری سرفیس (Surface)، ممکن است روزی به جای وب‌کم‌های مقرون به صرفه امروزی، شاهد یک وب‌کم قدرتمند از مایکروسافت باشیم.

«استفاده از هوش مصنوعی و محاسبات پیچیده‌ی اطلاعات جمع‌آوری شده در این حوزه برای گرد هم آوردن مردم و ایجاد این حس که در یک اتاق حضور دارند، همان چیزی است که ما همواره به آن علاقه داشته‌ایم، همان‌گونه که در «سرفیس پرو ایکس» هم شاهد آن هستید… ما به تکامل خود در این مسیر ادامه خواهیم داد.»

 

امیدواریم که با خواندن مطالب بالا به خوبی به سئوال شما مبنی بر مایکروسافت چگونه دوربین سرفیس هوشمند خود را ساخت؟ به خوبی پاسخ داده باشیم…

 

منبع: theverge

زهرا سلیمی
ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *