هوش مصنوعی، به ویژه فناوری تبدیل متن به گفتار، نقش مهمی در ارائه دسترسی برابر به اطلاعات برای افراد نابینا دارد. با تبدیل متن چاپ شده به گفتار شنیدنی، سیستمهای تبدیل متن به گفتار مبتنی بر هوش مصنوعی افراد نابینا را قادر میسازد تا به طیف گستردهای از مواد چاپی از جمله کتاب، روزنامه و سایر محتوای متنی دسترسی داشته باشند. این فناوری موانع اطلاعات را از بین میبرد و به افراد نابینا قدرت میدهد تا مطلع بمانند و با محتوای مکتوب درگیر شوند و در نهایت برابری در دسترسی به اطلاعات را ترویج کنند.
Ask Envision
Ask Envisionیک دستیار هوش مصنوعی چندوجهی است که از GPT-4 OpenAI استفاده میکند و میتواند عکسها و متن را بگیرد و پاسخهای محاورهای را تولید کند. این سیستم یکی از چندین محصول کمکی برای افراد کمبینا برای شروع ادغام مدلهای زبان بزرگ است و این نوید را میدهد که جزئیات بصری بسیار بیشتری در مورد دنیای اطراف خود و استقلال بسیار بیشتری به کاربران ارائه دهد.
Envision به عنوان یک برنامه تلفن هوشمند برای خواندن متن در عکسها در سال 2018 و سپس در گوگل گلس در اوایل سال 2021 راه اندازی شد. شرکتEnvision ، یک توسعهدهنده پیشرو در عینکهای هوشمند است که میتواند به افراد نابینا در خواندن و شناسایی اشیا کمک نماید. اوایل امسال نیز، این شرکت آزمایش یک مدل مکالمه منبع باز را آغاز کرد که میتواند به سوالات اساسی پاسخ دهد.

Good Maps
شرکت Good Maps سیستمهای نقشهبرداری مبتنی بر هوش مصنوعی را توسعه داده که اطلاعات دقیقی در مورد محیط اطراف ارائه میدهد و جهتهای گام به گام را از طریق دوربین گوشیهای هوشمند ارائه میدهد. با تکان دادن دوربین تلفن به اطراف، افراد نابینا میتوانند نشانههای شنیداری در زمان واقعی را در مورد مکان و نقاط مورد علاقه خود دریافت کنند. این فناوری استقلال را افزایش میدهد و به افراد نابینا کمک میکند تا با اطمینان در مکانهای جدید حرکت کنند.
Be My Eyes
Be My Eyes، یک برنامه 13 ساله است که به کاربران کمک میکند اشیاء اطراف خود را شناسایی کنند. پروژه «چشم من باش» سال 2015 راه اندازی شد و اکنون تقریبا نیم میلیون کاربر نابینا و کمبینا دارد. ایده این پروژه از هانس یورگن ویبرگ است که خودش دچار اختلال در بینایی است. این گروه نرمافزاری در حال یک همکاری دوجانبه با OpenAI برای ارتقای سرویسدهی است.
به گفته سارا برد، سرپرست هوش مصنوعی مایکروسافت که سرمایهگذار اصلی OpenAI است، آزمایش یکپارچهسازی GPT-4 را برای سرویس SeeingAI خود آغاز کرده که عملکردهای مشابهی را ارائه میدهد.
تحولی در دنیای نابینایان
سینا بهرام، دانشمند کامپیوتر نابینا و رئیس مشاوری که به موزهها، پارکهای موضوعی و شرکتهای فناوری مانند گوگل و مایکروسافت مشاوره میدهد، میگوید ادغام هوش مصنوعی در محصولات بینایی میتواند تأثیر عمیقی بر کاربران بگذارد.
بهرام از Be My Eyes با GPT-4 استفاده میکند و میگوید که مدل زبان بزرگ به دلیل قابلیتهایش و به دلیل اینکه محصولات را میتوان بدون زحمت و بدون نیاز به مهارتهای فنی استفاده کرد، تفاوتی با نسلهای قبلی فناوری ایجاد میکند. او میگوید این سطح از اطلاعات «چیزی است که یک سال پیش در خارج از آزمایشگاه وجود نداشت».
چالشهای این مسیر
دانا گوراری، استادیار علوم کامپیوتر در دانشگاه کلرادو در بولدر، میگوید که هیجانانگیز است که افراد نابینا در آستانه پذیرش فناوری هستند، اما این مسئله یعنی کامل نبودن GPT-4، کمی ترسناک است که چنین جمعیت آسیبپذیری باید با آن مقابله کنند.
گوراری دریافته است که در آزمایش اولیه برخی از مدلهای هوش مصنوعی میتوانند اطلاعات ناقص بسازند یا توهم ایجاد کنند. او میگوید: «بیشتر چیزی که میتوانید به آن اعتماد کنید فقط اشیاء سطح بالا هستند، مانند «من یک ماشین را میبینم، یک شخص را میبینم، من یک درخت را میبینم». این اطلاعات بیاهمیت نیست، اما کاربر نمیتواند لزوماً اعتماد کند که هوش مصنوعی به درستی به او بگوید چه چیزی در ساندویچش است.
درست است که وقتی افراد نابینا این اطلاعات را دریافت میکنند، از هیچی و تاریکی مطلق بهتر است اما مشکل وقتی به وجود میآید که آنها با اطلاعات جعلی تصمیم میگیرند و این عواقب بدی به دنبال دارد.
هنگام استفاده از فناوریهای هوش مصنوعی که به بینایی و نقشهبرداری رایانهای متکی هستند، حفظ حریم خصوصی یک نگرانی معتبر است. افراد نابینا ممکن است خواهان اطلاعاتی در مورد محیط اطراف خود باشند، اما برای محرمانه بودن اطلاعات شخصی خود نیز ارزش قائل هستند. بسیار مهم است که اطمینان حاصل شود که ذخیرهسازی و استفاده از دادهها با مقررات حفظ حریم خصوصی برای محافظت از اطلاعات حساس کاربران نابینا مطابقت دارد. ایجاد تعادل بین ارائه اطلاعات مفید و احترام به حریم خصوصی یکی از نکات کلیدی در توسعه و اجرای فناوریهای هوش مصنوعی برای جامعه نابینایان است.
استفاده از مدلهای زبان بزرگ امیدوارکننده هستند ولی مجموعه دادههایی که برای آموزش هوش مصنوعی استفاده شدهاند عموما بهعنوان اطلاعات منحرف و مغرضانه شناخته میشوند و پیشداوریها و خطاها را رمزگذاری میکنند. سیستمهای بینایی رایانهای برای تشخیص اشیا دارای سابقه سوگیری غربی هستند و تشخیص چهره خروجیهای کمتری برای گروههایی مانند افراد آسیایی و افراد با پوست تیره داشته اند.
سینا بهرام تصدیق میکند که اینها خطراتی هستند که جامعه نابینایان را تهدید میکند و به سیستمها پیشنهاد میکند که امتیاز اطمینان را به کاربران ارائه دهند تا بتوانند تصمیمات آگاهانهتری در مورد آنچه که هوش مصنوعی فکر میکند میبیند، بگیرند.
در واقع هوش مصنوعی به هیچ وجه کامل نیست، اما هر ذرهای از توضیحات به نابینایان از جهان پیرامونشان، برای آنها امیدوار کننده است.
منبع: https://www.wired.com/story/ai-gpt4-could-change-how-blind-people-see-the-world/
https://readwrite.com/how-ai-is-giving-blind-people-freedom-and-independence/



