Чат-бот, основанный на большой языковой модели (LLM), разработанной Google, оказался более точным, чем сертифицированные врачи в диагностике респираторных и сердечно-сосудистых заболеваний. По сравнению с врачами-людьми, ИИ удалось собрать аналогичный объем информации во время медицинских интервью и получить более высокий рейтинг эмпатии. Робот пока лечит робота. Конструктор изображений DALLE-3 Человеку иногда проще говорить с ИИ, чем с другим человеком. Этим и воспользовались разработчики диагностической модели.
Чат-бот, основанный на большой языковой модели (LLM), разработанной Google, оказался более точным, чем сертифицированные врачи в диагностике респираторных и сердечно-сосудистых заболеваний. По сравнению с врачами-людьми, ИИ удалось собрать аналогичный объем информации во время медицинских интервью и получить более высокий рейтинг эмпатии.
«Насколько нам известно, это первый случай, когда диалоговая система искусственного интеллекта была оптимально разработана для диагностического диалога и сбора истории болезни», — говорит Алан Картикесалингам, клинический исследователь из Google Health в Лондоне и соавтор исследования.
Чат-бот, получивший название Articulate Medical Intelligence Explorer (Точный исследователь медицинских данных — AMIE), пока остается чисто экспериментальным. Его не тестировали на людях с реальными проблемами со здоровьем — только на актерах, обученных изображать людей с заболеваниями. «Мы хотим, чтобы результаты интерпретировались с осторожностью», — говорит Картикесалингам.
Несмотря на то, что чат-бот еще не используется в клинической практике, авторы утверждают, что в конечном итоге он может сыграть роль в демократизации здравоохранения. Этот инструмент может быть полезным, но он не должен заменять взаимодействие с врачами, говорит Адам Родман, врач Гарвардской медицинской школы в Бостоне, штат Массачусетс. «Медицина – это нечто большее, чем просто сбор информации: все дело в человеческих отношениях», – говорит он.
ИИ сам себе врач и пациент
Человек и робот ставят диагнозhttps://medium.com/Одной из проблем, с которой столкнулись разработчики, была нехватка реальных разговоров между врачами и пациентами, которые можно было бы использовать в качестве обучающих данных, говорит Вивек Натараджан, соавтор исследования. Чтобы решить эту проблему, исследователи разработали способ обучения чат-бота на собственных «разговорам».
Исследователи провели первоначальный раунд тонкой настройки базовой LLM с использованием существующих наборов реальных данных, таких как электронные медицинские записи и расшифровки медицинских разговоров. Для дальнейшего обучения модели исследователи предложили LLM сыграть роль человека с определенным заболеванием и чуткого клинициста, стремящегося понять историю человека и разработать потенциальные диагнозы.
Команда также попросила модель сыграть еще одну роль: критика, который оценивает взаимодействие врача с человеком, проходящим лечение, и дает советы, как улучшить это взаимодействие. Эта критика используется для дальнейшего обучения LLM и улучшения диалогов.
Для тестирования системы исследователи привлекли 20 человек, которые были обучены выдавать себя за пациентов, и заставили их провести онлайн-консультации в текстовой форме — как с AMIE, так и с 20 сертифицированными врачами. Им не сказали, общаются ли они с человеком или ботом.
Актеры смоделировали 149 клинических сценариев, а затем их попросили оценить свой опыт. Группа специалистов также оценила работу AMIE и врачей.
AMIE проходит испытание
Робот-врачNY PostСистема ИИ не уступала или даже превосходила диагностическую точность врачей всех шести рассматриваемых медицинских специальностей. Бот превзошел врачей по 24 из 26 критериев качества разговора, включая вежливость, объяснение состояния и лечения, честность и выражение заботы и поддержки.
«Это никоим образом не означает, что языковая модель лучше, чем врачи, собирают историю болезни», — говорит Картикесалингам. Он отмечает, что врачи первичной медико-санитарной помощи, принимавшие участие в исследовании, вероятно, не привыкли взаимодействовать с пациентами посредством текстового чата, и это могло повлиять на их работу.
Источник