هوش مصنوعی گوگل به زودی می تواند از سرفه افراد برای تشخیص بیماری استفاده کند. سیستم یادگیری ماشینی آموزشدیده بر روی میلیونها کلیپ صوتی انسانی، نویدبخش تشخیص کووید-۱۹ و سل است.
به گزارش یابش و به نقل از نیچر، حوزه شنواییشناسی ابزارهای هوش مصنوعی را با صداهای انسانی مانند سرفه ترکیب میکند تا سلامتی را ارزیابی کند.
تیمی به رهبری دانشمندان گوگل ابزاری برای یادگیری ماشینی ایجاد کرده اند که می تواند با ارزیابی صداهایی مانند سرفه و تنفس به تشخیص و نظارت بر وضعیت سلامت کمک کند. سیستم هوش مصنوعی (AI) که بر روی میلیونها کلیپ صوتی از صدای انسان آموزش داده شده است، ممکن است روزی توسط پزشکان برای تشخیص بیماریهایی از جمله کووید-۱۹ و سل و ارزیابی عملکرد ریههای فرد مورد استفاده قرار گیرد.
این اولین بار نیست که یک گروه تحقیقاتی استفاده از صدا را به عنوان یک نشانگر زیستی برای بیماری ها بررسی می کند. این مفهوم در طول همهگیری COVID-19 مورد توجه قرار گرفت، زمانی که دانشمندان دریافتند که تشخیص بیماری تنفسی از طریق سرفه یک فرد امکان پذیر است .
آنچه در مورد سیستم Google وجود دارد – به نام Health Acoustic Representations (HeAR) – مجموعه داده های عظیمی است که بر روی آن آموزش دیده است و این واقعیت که می توان آن را برای انجام چندین کار به خوبی تنظیم کرد.
محققان که در اوایل این ماه این ابزار را در یک پیشچاپ گزارش کردند که هنوز بررسی نشده است، میگویند هنوز خیلی زود است که بگوییم HeAR به یک محصول تجاری تبدیل خواهد شد یا خیر. در حال حاضر، برنامه این است که محققان علاقه مند به این مدل دسترسی داشته باشند تا بتوانند از آن در تحقیقات خود استفاده کنند. Sujay Kakarmath، مدیر محصول گوگل در شهر نیویورک که روی این پروژه کار می کرد، می گوید: «هدف ما به عنوان بخشی از Google Research این است که نوآوری در این زمینه نوپا را تحریک کنیم.»
چگونه مدل خود را آموزش دهیم
اکثر ابزارهای هوش مصنوعی که در این فضا توسعه مییابند، بر روی ضبطهای صوتی – به عنوان مثال، سرفهها – که با اطلاعات سلامتی درباره فردی که صداها را تولید کرده است، آموزش داده میشوند. به عنوان مثال، ممکن است بر روی این کلیپ ها برچسب زده شود تا نشان دهد که فرد در زمان ضبط، برونشیت داشته است. این ابزار میآید تا ویژگیهای صداها را در یک فرآیند آموزشی به نام یادگیری نظارت شده با برچسب داده مرتبط کند.
در عوض، محققان Google از یادگیری خود نظارتی استفاده کردند که بر دادههای بدون برچسب متکی است . آنها از طریق یک فرآیند خودکار، بیش از ۳۰۰ میلیون کلیپ صوتی کوتاه از سرفه، تنفس، پاک کردن گلو و سایر صداهای انسانی را از ویدیوهای عمومی YouTube استخراج کردند.
هر کلیپ به نمایش تصویری صدا به نام طیف نگار تبدیل شد. سپس محققان بخشهایی از طیفنگارها را مسدود کردند تا به مدل کمک کنند تا قسمتهای از دست رفته را پیشبینی کند. این شبیه به این است که مدل زبان بزرگی که زیربنای ربات چت ChatGPT است، برای پیشبینی کلمه بعدی در یک جمله پس از آموزش بر روی نمونههای بیشماری از متن انسانی آموزش داده شد. با استفاده از این روش، محققان مدلی را ایجاد کردند که آن را مدل پایه می نامند، که به گفته آنها می تواند برای بسیاری از وظایف تطبیق داده شود.
یک یادگیرنده کارآمد
در مورد HeAR، تیم Google آن را برای تشخیص کووید-۱۹، سل و ویژگیهایی مانند سیگار کشیدن یک فرد تطبیق داد. از آنجایی که این مدل بر روی طیف وسیعی از صداهای انسانی آموزش دیده بود، برای تنظیم دقیق آن، محققان تنها مجبور بودند مجموعه دادههای بسیار محدودی را که با این بیماریها و ویژگیها برچسبگذاری شده بودند، تغذیه کنند.
در مقیاسی که ۰٫۵ نشاندهنده مدلی است که عملکرد بهتری از یک پیشبینی تصادفی ندارد و ۱ نشاندهنده مدلی است که هر بار پیشبینی دقیقی انجام میدهد، HeAR بسته به مجموعه دادههایی که روی آن آزمایش شده است، امتیاز ۰٫۶۴۵ و ۰٫۷۱۰ را برای تشخیص COVID-19 به دست آورد. عملکرد بهتری نسبت به مدلهای موجود آموزش داده شده بر روی دادههای گفتاری یا صدای عمومی. برای سل، امتیاز ۰٫۷۳۹ بود.
علی عمران، مهندس دانشگاه اوکلاهاما در تولسا، میگوید که حجم عظیم دادههای استفاده شده توسط گوگل به این تحقیق اهمیت میدهد. او میگوید: «این به ما این اطمینان را میدهد که این یک ابزار قابل اعتماد است».
عمران توسعه اپلیکیشنی به نام AI4COVID-19 را رهبری میکند که در تشخیص سرفههای COVID-19 از سایر انواع سرفهها امیدوارکننده است . تیم او قصد دارد برای تأیید از سازمان غذا و داروی ایالات متحده (FDA) درخواست کند تا برنامه بتواند در نهایت به بازار منتقل شود. او در حال حاضر به دنبال بودجه برای انجام آزمایشات بالینی لازم است. تاکنون هیچ ابزار مورد تایید FDA تشخیص را از طریق صداها ارائه نکرده است.
بنسوسان که یک کنسرسیوم تحقیقاتی را رهبری می کند که بر روی کاوش صدا به عنوان یک نشانگر زیستی برای ردیابی سلامت تمرکز دارد؛ معتقد است که حوزه آکوستیک سلامت یا «صوتیشناسی» امیدوارکننده است.
علم آکوستیک برای چندین دهه وجود داشته است. تفاوت این است که در حال حاضر، با هوش مصنوعی و یادگیری ماشینی، ما ابزار جمع آوری و تجزیه و تحلیل بسیاری از داده ها را به طور همزمان داریم.
او می گوید: «پتانسیل بسیار زیادی نه تنها برای تشخیص، بلکه برای غربالگری و نظارت وجود دارد. ما نمی توانیم هر هفته اسکن یا بیوپسی را تکرار کنیم. بنابراین به همین دلیل است که صدا به یک نشانگر زیستی واقعاً مهم برای نظارت بر بیماری تبدیل میشود.» او میافزاید. «این تهاجمی نیست، و منبع کمی است.»
منبع خبر:
https://www.nature.com/articles/d41586-024-00869-0