Искусственный интеллект может предсказывать события в жизни людей

Ученые из Технического университета Дании (TechnicalUniversityofDenmark) сделали вывод, что Искусственный интеллект может анализировать регистрационные данные о месте жительства, образовании, доходах, состоянии здоровья и условиях труда людей и с высокой точностью прогнозировать жизненные события. Об этом сообщает sciencedaily.

Искусственный интеллект, разработанный для моделирования письменной речи, может быть использован для прогнозирования событий в жизни людей.

Исследовательский проект DTU, Копенгагенского университета, ITU и Северо-Восточного университета в США показывает, что если вы используете большие объемы данных о жизни людей и обучаете так называемые «трансформаторные модели», которые (подобно ChatGPT) используются для обработки языка, они могут систематически упорядочивать данные и прогнозировать что произойдет в жизни человека и даже приблизительное время смерти.

В новой научной статье «Использование последовательности жизненных событий для прогнозирования человеческих жизней», опубликованной в Nature Computational Science, исследователи проанализировали данные о состоянии здоровья и привязанности к рынку труда 6 миллионов датчан в модели, получившей название life2vec. После того, как модель была обучена на начальном этапе, т. е. изучила закономерности в данных, было показано, что она превосходит другие продвинутые нейронные сети и с высокой точностью предсказывает такие результаты, как личность и время смерти.

«Мы использовали модель для решения фундаментального вопроса: в какой степени мы можем предсказать события в вашем будущем, основываясь на условиях и событиях в вашем прошлом? С научной точки зрения нас интересует не столько само предсказание, сколько аспекты данных, которые позволяют модели давать такие точные ответы», — говорит Сун Леманн, профессор DTU и первый автор статьи.

Прогнозы от Life2vec — это ответы на общие вопросы, такие как: «смерть в течение четырех лет»? Когда исследователи анализируют ответы модели, результаты согласуются с существующими выводами в области социальных наук; например, при прочих равных условиях люди, занимающие руководящую должность или имеющие высокий доход, имеют больше шансов выжить, в то время как принадлежность к мужскому полу, квалификация или наличие психического диагноза связаны с более высокой вероятностью риск смерти. Life2vec кодирует данные в большую систему векторов, математическую структуру, которая организует различные данные. Модель решает, где размещать данные о времени рождения, обучении в школе, образовании, зарплате, жилье и здоровье.

«Что интересно, так это рассматривать человеческую жизнь как длинную последовательность событий, подобно тому, как предложение в языке состоит из ряда слов. Обычно для этого типа задач используются трансформаторные модели в ИИ, но в наших экспериментах мы используем их для анализа того, что мы называем жизненными последовательностями, то есть событиями, которые произошли в жизни человека», — говорит Сун Леманн.

Исследователи, стоящие за статьей, отмечают, что модель life2vec связана с этическими вопросами, такими как защита конфиденциальных данных, конфиденциальность и роль предвзятости в данных. Эти проблемы должны быть поняты более глубоко, прежде чем модель можно будет использовать, например, для оценки риска заражения человека заболеванием или другими предотвратимыми жизненными событиями.

«Модель открывает важные позитивные и негативные перспективы для обсуждения и политического решения. Аналогичные технологии для прогнозирования жизненных событий и поведения людей уже используются сегодня в технологических компаниях, которые, например, отслеживают наше поведение в социальных сетях, чрезвычайно точно формируют наши профили и используют эти профили для прогнозирования нашего поведения и влияния на нас. Это обсуждение должно стать частью демократического диалога, чтобы мы могли понять, куда ведут нас технологии и хотим ли мы такого развития событий», — говорит Сун Леманн.

По словам исследователей, следующим шагом было бы включение других типов информации, таких как текст и изображения или информация о наших социальных связях. Такое использование данных открывает совершенно новое взаимодействие между социальными науками и наукой о здоровье.

Исследовательский проект «Использование последовательности жизненных событий для прогнозирования человеческих жизней» основан на данных о рынке труда и данных Национального регистра пациентов (LPR) и Статистического управления Дании. Набор данных включает в себя все 6 миллионов датчан и содержит информацию о доходах, заработной плате, стипендии, типе работы, отрасли, социальных пособиях и т. д. Набор данных о состоянии здоровья включает записи о посещениях медицинских работников или больниц, диагнозе, типе пациента и степени срочности. Набор данных охватывает период с 2008 по 2020 год, но в нескольких анализах исследователи фокусируются на периоде 2008−2016 годов и ограниченной по возрасту подгруппе лиц.

Модель transformer — это архитектура данных искусственного интеллекта с глубоким обучением, используемая для изучения языка и других задач. Модели можно обучить понимать и генерировать язык. Модель transformer разработана так, чтобы быть быстрее и эффективнее предыдущих моделей, и часто используется для обучения больших языковых моделей на больших наборах данных.

Нейронная сеть — это компьютерная модель, вдохновленная мозгом и нервной системой людей и животных. Существует много различных типов нейронных сетей (например, модели-трансформеры). Как и мозг, нейронная сеть состоит из искусственных нейронов. Эти нейроны связаны и могут посылать сигналы друг другу. Каждый нейрон получает входные данные от других нейронов, а затем вычисляет выходные данные, передаваемые другим нейронам. Нейронная сеть может научиться решать задачи, тренируясь на больших объемах данных. Нейронные сети полагаются на обучающие данные для обучения и повышения своей точности с течением времени. Но как только эти алгоритмы обучения будут точно настроены, они станут мощными инструментами в информатике и искусственном интеллекте, которые позволяют нам классифицировать и группировать данные с высокой скоростью. Одной из наиболее известных нейронных сетей является алгоритм поиска Google.