هوش مصنوعی خدمات فناورانه‌ای برای کمک به توصیف اشیا و افراد و محیط پیرامون به افراد نابینا و کم‌بینا داشته است.

مهسا زحمتکش
یکشنبه ۳۰ مهر ۱۴۰۲ - ۰۰:۰۰
هوش مصنوعی به کمک نابینایان می‌آید

هوش مصنوعی، به ویژه فناوری تبدیل متن به گفتار، نقش مهمی در ارائه دسترسی برابر به اطلاعات برای افراد نابینا دارد. با تبدیل متن چاپ شده به گفتار شنیدنی، سیستم‌های تبدیل متن به گفتار مبتنی بر هوش مصنوعی افراد نابینا را قادر می‌سازد تا به طیف گسترده‌ای از مواد چاپی از جمله کتاب، روزنامه و سایر محتوای متنی دسترسی داشته باشند. این فناوری موانع اطلاعات را از بین می‌برد و به افراد نابینا قدرت می‌دهد تا مطلع بمانند و با محتوای مکتوب درگیر شوند و در نهایت برابری در دسترسی به اطلاعات را ترویج کنند.

Ask Envision

 Ask Envisionیک دستیار هوش مصنوعی چندوجهی است که از GPT-4 OpenAI استفاده می‌کند و می‌تواند عکس‌ها و متن را بگیرد و پاسخ‌های محاوره‌ای را تولید کند. این سیستم یکی از چندین محصول کمکی برای افراد کم‌بینا برای شروع ادغام مدل‌های زبان بزرگ است و این نوید را می‌دهد که جزئیات بصری بسیار بیشتری در مورد دنیای اطراف خود و استقلال بسیار بیشتری به کاربران ارائه دهد.

Envision به عنوان یک برنامه تلفن هوشمند برای خواندن متن در عکس‌ها در سال 2018 و سپس در گوگل گلس در اوایل سال 2021 راه اندازی شد. شرکتEnvision ، یک توسعه‌دهنده پیشرو در عینک‌های هوشمند است که می‌تواند به افراد نابینا در خواندن و شناسایی اشیا کمک نماید. اوایل امسال نیز، این شرکت آزمایش یک مدل مکالمه منبع باز را آغاز کرد که می‌تواند به سوالات اساسی پاسخ دهد.

هوش مصنوعی به کمک نابینایان می‌آید

Good Maps

شرکت‌ Good Maps سیستم‌های نقشه‌برداری مبتنی بر هوش مصنوعی را توسعه داده‌ که اطلاعات دقیقی در مورد محیط اطراف ارائه می‌دهد و جهت‌های گام به گام را از طریق دوربین گوشی‌های هوشمند ارائه می‌دهد. با تکان دادن دوربین تلفن به اطراف، افراد نابینا می‌توانند نشانه‌های شنیداری در زمان واقعی را در مورد مکان و نقاط مورد علاقه خود دریافت کنند. این فناوری استقلال را افزایش می‌دهد و به افراد نابینا کمک می‌کند تا با اطمینان در مکان‌های جدید حرکت کنند.

Be My Eyes

Be My Eyes، یک برنامه 13 ساله است که به کاربران کمک می‌کند اشیاء اطراف خود را شناسایی کنند. پروژه «چشم من باش» سال 2015 راه اندازی شد و اکنون تقریبا نیم میلیون کاربر نابینا و کم‌بینا دارد. ایده این پروژه از هانس یورگن ویبرگ است که خودش دچار اختلال در بینایی است. این گروه نرم‌افزاری در حال یک همکاری دوجانبه با OpenAI برای ارتقای سرویس‌دهی‌ است.

 به گفته سارا برد، سرپرست هوش مصنوعی مایکروسافت که سرمایه‌گذار اصلی OpenAI است، آزمایش یکپارچه‌سازی GPT-4 را برای سرویس SeeingAI خود آغاز کرده که عملکردهای مشابهی را ارائه می‌دهد.

تحولی در دنیای نابینایان

سینا بهرام، دانشمند کامپیوتر نابینا و رئیس مشاوری که به موزه‌ها، پارک‌های موضوعی و شرکت‌های فناوری مانند گوگل و مایکروسافت مشاوره می‌دهد، می‌گوید ادغام هوش مصنوعی در محصولات بینایی می‌تواند تأثیر عمیقی بر کاربران بگذارد.

بهرام از Be My Eyes با GPT-4 استفاده می‌کند و می‌گوید که مدل زبان بزرگ به دلیل قابلیت‌هایش و به دلیل اینکه محصولات را می‌توان بدون زحمت و بدون نیاز به مهارت‌های فنی استفاده کرد، تفاوتی با نسل‌های قبلی فناوری ایجاد می‌کند. او می‌گوید این سطح از اطلاعات «چیزی است که یک سال پیش در خارج از آزمایشگاه وجود نداشت».

چالش‌های این مسیر

دانا گوراری، استادیار علوم کامپیوتر در دانشگاه کلرادو در بولدر، می‌گوید که هیجان‌انگیز است که افراد نابینا در آستانه پذیرش فناوری هستند، اما این مسئله یعنی کامل نبودن GPT-4، کمی ترسناک است که چنین جمعیت آسیب‌پذیری باید با آن مقابله کنند.

گوراری دریافته است که در آزمایش اولیه برخی از مدل‌های هوش مصنوعی می‌توانند اطلاعات ناقص بسازند یا توهم ایجاد کنند. او می‌گوید: «بیشتر چیزی که می‌توانید به آن اعتماد کنید فقط اشیاء سطح بالا هستند، مانند «من یک ماشین را می‌بینم، یک شخص را می‌بینم، من یک درخت را می‌بینم». این اطلاعات بی‌اهمیت نیست، اما کاربر نمی‌تواند لزوماً اعتماد کند که هوش مصنوعی به درستی به او بگوید چه چیزی در ساندویچش است.

درست است که وقتی افراد نابینا این اطلاعات را دریافت می‌کنند، از هیچی و تاریکی مطلق بهتر است اما  مشکل وقتی به وجود می‌آید که آنها با اطلاعات جعلی تصمیم می‌گیرند و این عواقب بدی به دنبال دارد.

هنگام استفاده از فناوری‌های هوش مصنوعی که به بینایی و نقشه‌برداری رایانه‌ای متکی هستند، حفظ حریم خصوصی یک نگرانی معتبر است. افراد نابینا ممکن است خواهان اطلاعاتی در مورد محیط اطراف خود باشند، اما برای محرمانه بودن اطلاعات شخصی خود نیز ارزش قائل هستند. بسیار مهم است که اطمینان حاصل شود که ذخیره‌سازی و استفاده از داده‌ها با مقررات حفظ حریم خصوصی برای محافظت از اطلاعات حساس کاربران نابینا مطابقت دارد. ایجاد تعادل بین ارائه اطلاعات مفید و احترام به حریم خصوصی یکی از نکات کلیدی در توسعه و اجرای فناوری‌های هوش مصنوعی برای جامعه نابینایان است.

استفاده از مدل‌های زبان بزرگ امیدوارکننده هستند ولی مجموعه داده‌هایی که برای آموزش هوش مصنوعی استفاده شده‌اند عموما به‌عنوان اطلاعات منحرف و مغرضانه شناخته می‌شوند و پیشداوری‌ها و خطاها را رمزگذاری می‌کنند. سیستم‌های بینایی رایانه‌ای برای تشخیص اشیا دارای سابقه سوگیری غربی هستند و تشخیص چهره خروجی‌های کمتری برای گروه‌هایی مانند افراد آسیایی و افراد با پوست تیره داشته اند.

سینا بهرام تصدیق می‌کند که این‌ها خطراتی هستند که جامعه نابینایان را تهدید می‌کند و به سیستم‌ها پیشنهاد می‌کند که امتیاز اطمینان را به کاربران ارائه دهند تا بتوانند تصمیمات آگاهانه‌تری در مورد آنچه که هوش مصنوعی فکر می‌کند می‌بیند، بگیرند.

در واقع هوش مصنوعی به هیچ وجه کامل نیست، اما هر ذره‌ای از توضیحات به نابینایان از جهان پیرامونشان، برای آنها امیدوار کننده است.

منبع: https://www.wired.com/story/ai-gpt4-could-change-how-blind-people-see-the-world/

https://readwrite.com/how-ai-is-giving-blind-people-freedom-and-independence/

برچسب‌ها

پربازدیدها

پربحث‌ها