
ساختار دوربین هوشمند سرفیس های مایکروسافت چگونه است؟
«از روز اول تولید دستگاههای سرفیس هاب ۲ (Surface Hub 2) ما میدانستیم که دوربینهای خود را هوشمند خواهیم کرد.» اینها سخنان «استیون بتیش» مسئول نظارت بر اختراعات و نوآوریهای شرکت مایکروسافت است. دوربین هوشمند سرفیس هاب ۲، یک سورپرایز 799.99 دلاری از سوی کمپانی بزرگ مایکروسافت است که هفته گذشته از آن رونمایی شد. این دوربین، چارچوب بندی خودکار تصاویر را بدون خطای پرسپکتیو و مواردی که معمولا در سایر دوربینهای اتاق کنفرانس مشاهده میکنید، ارائه میدهد. برای پاسخ به سئوالات شما که مایکروسافت چگونه دوربین سرفیس هوشمند خود را ساخت؟ در ادامه با آرتل همراه شوید.
دوربین های هوشمند مایکروسافت چگونه ساخته می شوند:
این دستگاه میتواند چهرهها و بدنهای حاضر در اتاق کنفرانس را تا شعاع ۸ متری خود شناسایی کند تا مطمئن شود همه افراد در یک اتاق در طول جلسات قابل مشاهده هستند. دوربین هوشمند سرفیس هاب ۲ به لطف میدان دید 136 درجهای خود، تقریبا میتواند کل اتاق کنفرانس را بهخوبی پوشش دهد؛ آن هم در حالی که هم افراد نزدیک و هم افراد دورتر، دارای وضوح (Focus) تصویری مناسب باشند.
مایکروسافت در نظر داشت تا دوربین سرفیس هاب ۲ خود را قبل از شیوع بیماری همه گیر کرونا به بازار عرضه کند تا بتواند به پیشبرد جلسات هیبریدی (جلساتی که هم شرکت کنندهی حضوری و هم غیرحضوری دارد) کمک بهسزایی داشته باشد. به همین دلیل است که این وسیله، بهشکل ماژولار طراحی شده و میتوان آن را از بالای نمایشگرهای 55 یا 85 اینچی جدا کرد.
«ما می دانستیم که می خواهیم این تجربه را (تجربهی جلسات هیبریدی) توسعه دهیم. ما دقیقا نمیدانستیم چگونه و یا به چه شکل این تغییر را ایجاد خواهیم کرد اما مطمئن بودیم که قرار است شکل برگزاری جلسات تغییر کند و این تغییر میبایست با توجه به نیازهای مردم و همسو با سیر تکامل اتاق کنفرانس و فرهنگ حاکم بر نحوهی برگزاری این جلسات باشد.
دستگاههای بزرگی مانند سرفیس هاب ۲، با داشتن صفحه نمایش 85 اینچی، چالشهایی را برای به تصویر کشیدن همه افراد در یک اتاق جلسه با دوربین سنتی ارائه کردند. بتیش میگوید: «ما برای اداره اتاقهای بزرگتر به دوربینی متفاوت از تکنولوژی رایج نیاز داشتیم»، بنابراین شرکت (مایکروسافت) دست به کار شد.
بتیش و تیم متخصص تحت نظارت او، یک ساز و کار اپتیکال جدید، مدل هوش مصنوعی و کامپیوتر «اج» را برای دستیابی به این هدف طراحی و تولید کردند و توانستند توان محاسباتی و عکاسی دوربین ساخته شده را به شکل محسوسی افزایش دهند. بتیش میگوید در باره سئوال مایکروسافت چگونه دوربین سرفیس هوشمند خود را ساخت؟ چنین می گوید: «این دستگاه دارای محاسبهگر داخلی با ظرفیت محاسباتی 1 ترافلاپس است تا بتواند پاسخ گوی نیازهای محاسباتی هوش مصنوعی به کار رفته در دوربین باشد.»
این توان محاسباتی شامل برنامه اتوفریمینگی که در دوربین قرار دارد، نیز میشود. بنابراین چیزی که بیرون میآید فقط یک تصویر «4K» است، بدون نیاز به نرمافزاری جانبی برای خواندن و یا دریافت تصاویر ضبط شده و ارسال آن به سیستم عامل. این بدان معناست که: این دستگاه به معنای واقعی کلمه مانند یک وب کم برای سرفیس هاب به نظر میرسد.
این بدان معناست که تمام کارهای هوش مصنوعی روی خود دوربین انجام میشود و برای پردازش به فضای ابری یا حتی از طریق سیم به سرفیس هاب 2 ارسال نمیشود. دوربین مدل هوش مصنوعی را اجرا میکند، تمام دادهها را پردازش میکند و بر اساس آن تصمیم میگیرد که تصویر را برش دهد. در حالی که کادربندی خودکار میتواند همه افراد یک اتاق را بهطور اتوماتیک ثبت کند، دوربین هوشمند همچنین از جبران شیب برای تنظیم تصویر برای موقعیت دوربین و ایجاد تماس چشمی طبیعیتر استفاده میکند. همچنین میتواند جلوه چشم ماهی (Fish Eye) را از لنزهای زاویه باز حذف کند تا افراد در داخل اتاقهای جلسه دچار اعوجاج نشوند یا کشیده به نظر نرسند.
بتیش توضیح میدهد: «ما یک لنز دارای ۱۱ عنصر، کاملا شیشهای و با وضوح فوقالعاده نزدیک به حد شکست طراحی کردیم. در پشت لنز یک سنسور 12 مگاپیکسلی (4000 در 3000) با دیافراگم ثابت ۱.۸ قرار دارد که همگی در تولید تصویری با کیفیت «4K» نقشی اساسی را ایفا میکنند. هرچند زاویهی دید واقعی لنز ۱۸۴ درجه است که این یعنی دوربین میتواند پشت سر خود را هم مشاهده کند، هرچند هنگام خروجی دادن تنها از زاویهای ۱۳۶ درجهای پشتیبانی میکند.»
با این حال، تمام این قطعات سخت افزاری بدون هوش مصنوعی که دوربین هوشمند سرفیس را پشتیبانی میکنند، چیزی نیستند. مایکروسافت این پروژه را قبل از همهگیری آغاز کرد، اما باید مدل هوش مصنوعی خود را در طول همهگیری آموزش و ارتقا میداد تا چالش پر کردن اتاقهای جلسه با مردم را به خوبی پشت سر بگذارد.
بتیش در مصاحبهی خود توضیح میدهد که: «ما به نیوزلند رفتیم زیرا آنها هیچ مورد کرونایی نداشتند و ما نیز دفاتری در آنجا داشتیم. ما بازیگران مرد و بازیگران زن را برای آزمایش فناوری و جمع آوری دادهها در انواع اتاقها استخدام کردیم، زیرا برای طراحی هوش مصنوعی مدنظر خود به مجموعهای عظیم از دادهها نیاز داشتیم.»
مایکروسافت مدل هوش مصنوعی خود را روی صورت و بدن آموزش داد تا مطمئن شود که کاملا فراگیر است و افرادی را که همیشه رو به دوربین نیستند شناسایی میکند. حتی از افراد و چهرههای مصنوعی برای بهبود تنوع خود در موقعیتها و چهرههای متفاوت استفاده کرد. مسئول نظارت بر اختراعات مایکروسافت میافزاید: «ما یک فناوری داخلی بسیار جالب داریم که میتواند بر اساس دادههای دریافتی، اقدام به تولید دادههای مصنوعی کند، بنابراین توانستیم افراد و چهرههای مصنوعی تولید کنیم.»
دوربین هوشمند برای تشخیص حیوانات خانگی یا حیوانات آموزش ندیده است. بنابراین این بدان معناست که اگر گربه یا سگ اداری وارد دید شود، سعی نمیشود بهطور خودکار یک جلسه را مجدد تنظیم کند. مایکروسافت همچنین اصول حقوق و قانونی هوش مصنوعی خود را در این پروژه اعمال کرده است که شامل مجموعهای از قوانین و شروط است تا این اطمینان را به مخاطبان خود بدهد که دادههای شخصی جمعآوری شده توسط این هوش مصنوعی به شکلی عادلانه و به دور از نیات سوء، مورد استفاده قرار خواهد گرفت.
«اگر به مجموعه دادههای ما نگاه کنید، از نظر تفاوت بین گروههای مختلف سنی، نژادی، جنسیت، رنگ پوست، مدلهای مو و غیره، کاملا شگفتانگیز است. من فکر میکنم یکی از چیزهایی که در دوربین گنجانده شده و ممکن است افراد با دیدن روی جعبه متوجه آن نشوند، استحکام و جامعیتی است که این مدل دوربین دارد. در ادامه این رئیس رده بالای مایکروسافت میگوید که: «ما این امکان را داشتیم که یک سال قبل این دوربین را روانهی بازار کنیم؛ اما شرکت در سال گذشته به صورت مداوم مشغول ارزیابی قابلیتهای خودکار قاببندی دوربین هوشمند خود بود تا مطمئن شود که آنقدر تند یا کند نیست و محتوا را از دست نمیدهد. هر فریمی که دوربین به دست میآورد، تصمیم میگیرد که آیا ارزش آن را دارد که تصویر را جابهجا کند و دوباره برش دهد یا نه.»
با خواندن این ویژگیها ممکن است مشتاق شده باشید که از این دوربین 799.99 دلاری روی یک رایانه شخصی ویندوزی معمولی استفاده کنید، اما موضوع به این سادگی نیست. در حالی که تمام مدلهای محاسباتی و هوش مصنوعی در داخل دوربین هوشمند سرفیس هاب ۲ قرار دارد، اما دوربین واقعاً برای استفاده به عنوان یک وبکم معمولی طراحی نشده است. بتیش در این مورد توضیح میدهد که: «ارتفاع، زوایا و هوش مصنوعی برای چندین نفر دور و نزدیک طراحی شده است. هرچند از منظر فنی میتوانید از یک پایه برای این دوربین طراحی کنید و آن را به رایانه شخصی متصل کنید، اما فکر نمیکنم آنگونه که انتظارش را دارید پاسخگوی نیاز خانگی شما باشد»
این اولین باری نیست که مایکروسافت روی بهبود وبکمها و دوربینهای خود تمرکز میکند. سرفیس پرو ایکس (Surface Pro X) در حال حاضر دارای ویژگی تماس چشمی مبتنی بر هوش مصنوعی است که به نظر میرسد شما همیشه در حال برقراری تماس چشمی هستید بدون توجه به آنچه در طول یک تماس ویدیویی به دنبال آن هستید. اپل نیز یک ویژگی مشابه با نام «FaceTime Attention Correction » را به iOS 13 اضافه کرد. بتیش میگوید: «الگوریتمهایی که در تماس چشمی [برای Surface Pro X] استفاده میکنیم، همان الگوریتمهایی هستند که برای تشخیص چهرهها در داخل این دوربین استفاده میکنیم.»
مایکروسافت به وضوح این دوربین هوشمند را برای سرفیس هاب ۲ طراحی کرده، اما با شایعات مداوم در مورد وبکمهای با نام تجاری سرفیس (Surface)، ممکن است روزی به جای وبکمهای مقرون به صرفه امروزی، شاهد یک وبکم قدرتمند از مایکروسافت باشیم.
«استفاده از هوش مصنوعی و محاسبات پیچیدهی اطلاعات جمعآوری شده در این حوزه برای گرد هم آوردن مردم و ایجاد این حس که در یک اتاق حضور دارند، همان چیزی است که ما همواره به آن علاقه داشتهایم، همانگونه که در «سرفیس پرو ایکس» هم شاهد آن هستید… ما به تکامل خود در این مسیر ادامه خواهیم داد.»
امیدواریم که با خواندن مطالب بالا به خوبی به سئوال شما مبنی بر مایکروسافت چگونه دوربین سرفیس هوشمند خود را ساخت؟ به خوبی پاسخ داده باشیم…
منبع: theverge