Не так давно учёные заметили, что кашель больного коронавирусом звучит немного иначе, чем у пациентов с другими заболеваниями. Это натолкнуло исследователей из Замбии и США на мысль о создании программы, способной различать типы кашля.
Обычно для обучения искусственного интеллекта используют заранее проанализированные человеком записи. Так, во время изучения данных ИИ получает одновременно и запись, и информацию о соответствующем заболевании. Такое обучение ИИ легко контролируется, но вместе с тем ограничивает данные для обучения. На этот раз разработчики пошли другим путём.
Из открытых источников было взято, а затем преобразовано в спектрограммы 313 миллионов двухсекундных записей кашля. Затем, используя алгоритм подобный тому, на котором обучаются боты ChatGPT, ИИ научили предсказывать следующий фрагмент спектрограммы и только после этого загрузили образцы кашля с заранее известными диагнозами.
Подобный подход, по мнению разработчиков, помог обучить ИИ на более широком диапазоне данных. Однако абсолютной точности от нейросети добиться всё равно не удалось. Если оценивать результаты по шкале, где 0,5 – это случайное попадание, а 1- точное определение диагноза, то при выявлении COVID-19 нейросеть набрала всего 0,645-0,710 баллов, а при выявлении туберкулёза 0,739 баллов. Утверждается, что программа также может выявить кашель курящего человека.
На данном этапе авторы программы намерены передать её другим исследователям для научной работы и не стремятся коммерциализировать проект.